- 이것이 취업을 위한 코딩테스트다 with 파이썬
- 정보처리기사
- boostcourse
- 부스트코스
- boostcoures
- 파이썬
- 데이터베이스
- 오라클
- python
- 빅데이터 분석 기반 에너지 운영 관리자 양성 및 취업과정
- 코딩테스트 python
- AI 플랫폼을 활용한 데이터 분석
- 이기적
- 네이버부스트캠프
- 난생처음 R코딩&데이터 분석 저서
- 코딩테스트
- 기초다지기
- Machine Learning
- 빅데이터분석기사
- PY4E
- 프로그래머스
- 빅분기
- 인공지능기초다지기
- Ai
- 데이터 분석 기반 에너지 운영 관리자 양성 및 취업과정
- DB
- SQL
- [멀티잇]데이터 시각화&분석 취업캠프(Python)
- r
- Oracle
- Today
- Total
목록파이썬 (17)
매일공부

커리큘럼에 포함된 파이썬 기초수업을 들으면서 전체 함수랑 모듈 리마인드하다가 계속 궁금했던 사실을 발견 gap = pd.read_csv('data/gapminder.tsv', sep='\t') gap.sample(5) gap_gpd = gap.groupby('continent') gap_gpd # >> 왜 항상 그룹을 하면 주소값으로 저장이 되는 걸까하고 궁금해야하면서 항상 하라는데로 집계함수 사용했음 print(gap_gpd.groups) #{'Africa': [24, 25, 26, 27, 28, 29, 30, 31, 32, ...], 'Americas': [48, 49, ...] ... 그러다가 groups라는 함수가 있기에 그냥 찍어보니 딕셔너리 형식으로 저장이 되어 있음 그래서 든 생각. 그냥 D..
다중 인덱스(multi-index) - 행과 열에 다중 인덱스 정의 할 수 있음 - columns(index) 인수에 리스트의 리스트(행렬) 형태 = 다중 열(행) 인덱스 - 열(행) 인덱스들의 이름 지정 = columns(index) 객체의 names 속성에 리스트를 넣어서 지정 import pandas as pd np.random.seed(0) df4 = pd.DataFrame( np.round(np.random.randn(6, 4), 2), columns=[["A", "A", "B", "B"], ["C", "D", "C", "D"]], index=[["M", "M", "M", "F", "F", "F"], ["id_" + str(i + 1) for i in range(3)] * 2]) df4.colu..
CSV&txt 파일을 불러와서 DataFrame으로 반환 import pandas as pd pd.read_csv('경로/이름', sep='구분자', header=None, names=['new 열이름', ...] ) sep= 기본 ','(comma) names=[] : column name(변수 이름)이 없는 파일 로드 할때 이름 부여 header=0(디폴트 값) : 1번째행이 column name =None : column name이 없다 usecols=[0, 2, 5] or (0, 2, 5) or ['열이름', ...] : 불러올 컬럼의 인덱스 번호나 이름 지정 참고 = https://useful-jang.tistory.com/55 index_col = 특정 컬럼(열)을 행 인덱스로 설정 nrows..
pd.merge 활용 > 교집합을 포함한 차집합 구할 수 있음 - 교집합을 포함하지 않은 진짜 차집합만 구하려면? pd.merge() + .query() + .drop() = 모두 함께 활용 Q. Series ser1에서 Series ser1에 있는 항목을 제거하시오 입력> ser1 = pd.Series([1, 2, 3, 4, 5]) ser2 = pd.Series([4, 5, 6, 7, 8]) ser1 = pd.Series([1, 2, 3, 4, 5]) ser2 = pd.Series([4, 5, 6, 7, 8]) ser1.name = 0 #series data에 이름 부여 ser2.name = 0 #outer속성으로 합집합으로 merge하고 추가 열에 교집합 표시(indicator) ser1 = pd.m..
Python Modeling library NumPy 라이브러리 : 동일한 데이터 유형의 값을 저장하는 고성능 다차원 배열 개체 : 배열 및 벡터화에 대한 수학 연산이 용이 SciPy 라이브러리 : NumPy 배열 객체를 기반 Matplotlib(시각화), Pandas(데이터정제) 및 SymPy와 같은 도구를 포함하는 스택의 일부 : 선형 대수, 보간, 최적화, 통합 및 통계와 같은 효율적인 수학 루틴을위한 모듈이 포함 Matplotlib : 2D 시각화 Seaborn : 고급 기능을 갖춘 Matplotlib의 확장 > 높은 수준의 추상화, 다중 플롯 그리드 제공 Scikit-learn : 온갖 머신러닝 라이브러리가 있는 기계학습 라이브러리 TensorFlow : 이미지 분류에 최적화되어 있는 라이브러리..
numpy 수치해석, 과학계산을 위한 파이썬 핵심라이브러리 C언어로 구현된 라이브러리 array 단위 > 데이터 관리 및 연산 수행 ndarray : nd(다차원) + array(배열, 동일한 타입의 값을 요소로 저장) = 고성능의 다차원 배열 자료구조 NumPy documentation : https://numpy.org/doc/stable/ 호출 = import numpy as np numpy 다차원 배열이란? 적은 메모리로 많은 데이터를 빠르게 처리 가능 모든 원소 = 같은 자료형(type) > 원소에 대한 접근&반복문 실행이 빨라짐 생성 시 선언한 size 동적 변경 불가 = 원소의 개수 변경X > 처음에 (4, 4) 배열을 생성하면 > (5, 5) 등 다른 size로 바꿀 수가 없음 배열 연산 ..
Q. 주사위를 10번 던져서 각 숫자가 몇 번씩 나왔는지 알아보려 한다. 리스트를 활용하여 리스트에 각 주사위를 던져 나온 숫자의 개수를 저장하고 출력하시오. import random dice = [] for i in range(10): dice.append(random.randint(1, 6)) print("1이 나온 개수 :", dice.count(1)) print("2이 나온 개수 :", dice.count(2)) print("3이 나온 개수 :", dice.count(3)) print("4이 나온 개수 :", dice.count(4)) print("5이 나온 개수 :", dice.count(5)) print("6이 나온 개수 :", dice.count(6)) 1이 나온 개수 : 3 2이 나온 개수..
- 1차원 리스트 연습문제 Q. 1~100사이의 정수 난수 10개 중에서 max값 출력하라 import random ran_number = [] for i in range(10): ran_number.append(random.randint(1, 100)) ran_number.sort() print("저장된 난수 10개 :", ran_number) print("난수 중에서 가장 큰 값 :", ran_number[9]) 저장된 난수 10개 : [11, 18, 28, 33, 35, 42, 42, 72, 75, 80] 난수 중에서 가장 큰 값 : 80 Q. 1~100 사이의 정수 난수 10개 중에서 5의 배수의 개수와 합계 평균을 출력하라 import random ran_number = [] ran_number..
- 예외 : 프로그램을 개발하면서 예상하지 못한 상황 발생 - 예측 가능한 예외 : 개발자가 사전에 인지 > 예외 발생 시 어떻게 대응하라고 명시 - 예측 불가능한 예외 : 프로그램 종료됨 > 매우 많은 파일 처리 시 발생 가능 - try except 구문 코드 실행 후 try except문 종료 IndexError 리스트의 인덱스 범위 넘어갈 때 ValueError 변환할 수 없는 문자나 숫자 변환 시 NameError 존재하지 않는 변수 호출 FileNotFoundError 존재하지 않는 파일 호출 ZeroDivisionError 0으로 숫자 나눌 때 TypeError 데이터 유형이 잘못 됐을 때 파이썬 예외클래스 계층구조 이미지 참조 - https://python.bakyeono.net/chapte..

1. 5행 4열 행렬 출력 #outer 반복문은 행 수, inner 반복문은 열 수 for row in range(5): for col in range(4): print("({0}, {1})".format(row, col), end=" ") print() #tuple 사용 for row in range(5): for col in range(4): a = (row, col) print(a, end=" ") print() 2. 정사각형 * 출력 for row in range(5): for col in range(5): print("*", end=" ") print() 3. 다양한 직각 정삼각형 * 출력 #반복문 for row in range(1, 6): for col in range(row): print("..