일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 빅데이터분석기사
- python
- 네이버부스트캠프
- Oracle
- 부스트코스
- Ai
- 코딩테스트
- 난생처음 R코딩&데이터 분석 저서
- 코딩테스트 python
- 인공지능기초다지기
- 이것이 취업을 위한 코딩테스트다 with 파이썬
- 오라클
- 빅분기
- 데이터베이스
- Machine Learning
- r
- 이기적
- boostcourse
- DB
- SQL
- boostcoures
- PY4E
- 데이터 분석 기반 에너지 운영 관리자 양성 및 취업과정
- 정보처리기사
- 프로그래머스
- [멀티잇]데이터 시각화&분석 취업캠프(Python)
- 파이썬
- AI 플랫폼을 활용한 데이터 분석
- 기초다지기
- 빅데이터 분석 기반 에너지 운영 관리자 양성 및 취업과정
- Today
- Total
목록Programming/Python (40)
매일공부

커리큘럼에 포함된 파이썬 기초수업을 들으면서 전체 함수랑 모듈 리마인드하다가 계속 궁금했던 사실을 발견 gap = pd.read_csv('data/gapminder.tsv', sep='\t') gap.sample(5) gap_gpd = gap.groupby('continent') gap_gpd # >> 왜 항상 그룹을 하면 주소값으로 저장이 되는 걸까하고 궁금해야하면서 항상 하라는데로 집계함수 사용했음 print(gap_gpd.groups) #{'Africa': [24, 25, 26, 27, 28, 29, 30, 31, 32, ...], 'Americas': [48, 49, ...] ... 그러다가 groups라는 함수가 있기에 그냥 찍어보니 딕셔너리 형식으로 저장이 되어 있음 그래서 든 생각. 그냥 D..
isdigit() vs isnumeric() vs isdecimal() isdecimal 10진수만 True Decimal characters are those that can be used to form numbers in base 10 isdigit 일반적인 모든 숫자 + 수학적인 함수 포함(분수, 로그 등) Digits include decimal characters and digits that need special handling, such as the compatibility superscript digits. This covers digits which cannot be used to form numbers in base 10, like the Kharosthi numbers. isnumer..
진법 변환 Casting casting 캐스팅함수 = 강제적으로 변환 2진수(binary): 0b 혹은 0B 8진수(octal): 0o 혹은 0O 16진수(hex): 0x 혹은 0X >> 10진수로 출력됨 bin() : 10진수를 2진수로 변환 (0b~) oct() : 10진수를 8진수로 변환 (0o~) hex() : 10진수를 16진수로 변환 (0h~) >> 문자열로 반환됨 >> TypeError = 'float' 타입은 변경 불가 int(num, num의 진법) : n진수를 10진수로 변환 format() 함수 = 10진수로 출력 되는 걸 해당 진수 그대로 출력할 때 print(100, format(100, 'b')) # 100 1100100 2진수 print(100, format(100, 'o'))..
다중 인덱스(multi-index) - 행과 열에 다중 인덱스 정의 할 수 있음 - columns(index) 인수에 리스트의 리스트(행렬) 형태 = 다중 열(행) 인덱스 - 열(행) 인덱스들의 이름 지정 = columns(index) 객체의 names 속성에 리스트를 넣어서 지정 import pandas as pd np.random.seed(0) df4 = pd.DataFrame( np.round(np.random.randn(6, 4), 2), columns=[["A", "A", "B", "B"], ["C", "D", "C", "D"]], index=[["M", "M", "M", "F", "F", "F"], ["id_" + str(i + 1) for i in range(3)] * 2]) df4.colu..
CSV&txt 파일을 불러와서 DataFrame으로 반환 import pandas as pd pd.read_csv('경로/이름', sep='구분자', header=None, names=['new 열이름', ...] ) sep= 기본 ','(comma) names=[] : column name(변수 이름)이 없는 파일 로드 할때 이름 부여 header=0(디폴트 값) : 1번째행이 column name =None : column name이 없다 usecols=[0, 2, 5] or (0, 2, 5) or ['열이름', ...] : 불러올 컬럼의 인덱스 번호나 이름 지정 참고 = https://useful-jang.tistory.com/55 index_col = 특정 컬럼(열)을 행 인덱스로 설정 nrows..
pd.merge 활용 > 교집합을 포함한 차집합 구할 수 있음 - 교집합을 포함하지 않은 진짜 차집합만 구하려면? pd.merge() + .query() + .drop() = 모두 함께 활용 Q. Series ser1에서 Series ser1에 있는 항목을 제거하시오 입력> ser1 = pd.Series([1, 2, 3, 4, 5]) ser2 = pd.Series([4, 5, 6, 7, 8]) ser1 = pd.Series([1, 2, 3, 4, 5]) ser2 = pd.Series([4, 5, 6, 7, 8]) ser1.name = 0 #series data에 이름 부여 ser2.name = 0 #outer속성으로 합집합으로 merge하고 추가 열에 교집합 표시(indicator) ser1 = pd.m..
Python Modeling library NumPy 라이브러리 : 동일한 데이터 유형의 값을 저장하는 고성능 다차원 배열 개체 : 배열 및 벡터화에 대한 수학 연산이 용이 SciPy 라이브러리 : NumPy 배열 객체를 기반 Matplotlib(시각화), Pandas(데이터정제) 및 SymPy와 같은 도구를 포함하는 스택의 일부 : 선형 대수, 보간, 최적화, 통합 및 통계와 같은 효율적인 수학 루틴을위한 모듈이 포함 Matplotlib : 2D 시각화 Seaborn : 고급 기능을 갖춘 Matplotlib의 확장 > 높은 수준의 추상화, 다중 플롯 그리드 제공 Scikit-learn : 온갖 머신러닝 라이브러리가 있는 기계학습 라이브러리 TensorFlow : 이미지 분류에 최적화되어 있는 라이브러리..
numpy 수치해석, 과학계산을 위한 파이썬 핵심라이브러리 C언어로 구현된 라이브러리 array 단위 > 데이터 관리 및 연산 수행 ndarray : nd(다차원) + array(배열, 동일한 타입의 값을 요소로 저장) = 고성능의 다차원 배열 자료구조 NumPy documentation : https://numpy.org/doc/stable/ 호출 = import numpy as np numpy 다차원 배열이란? 적은 메모리로 많은 데이터를 빠르게 처리 가능 모든 원소 = 같은 자료형(type) > 원소에 대한 접근&반복문 실행이 빨라짐 생성 시 선언한 size 동적 변경 불가 = 원소의 개수 변경X > 처음에 (4, 4) 배열을 생성하면 > (5, 5) 등 다른 size로 바꿀 수가 없음 배열 연산 ..
Q. 주사위를 10번 던져서 각 숫자가 몇 번씩 나왔는지 알아보려 한다. 리스트를 활용하여 리스트에 각 주사위를 던져 나온 숫자의 개수를 저장하고 출력하시오. import random dice = [] for i in range(10): dice.append(random.randint(1, 6)) print("1이 나온 개수 :", dice.count(1)) print("2이 나온 개수 :", dice.count(2)) print("3이 나온 개수 :", dice.count(3)) print("4이 나온 개수 :", dice.count(4)) print("5이 나온 개수 :", dice.count(5)) print("6이 나온 개수 :", dice.count(6)) 1이 나온 개수 : 3 2이 나온 개수..
- 1차원 리스트 연습문제 Q. 1~100사이의 정수 난수 10개 중에서 max값 출력하라 import random ran_number = [] for i in range(10): ran_number.append(random.randint(1, 100)) ran_number.sort() print("저장된 난수 10개 :", ran_number) print("난수 중에서 가장 큰 값 :", ran_number[9]) 저장된 난수 10개 : [11, 18, 28, 33, 35, 42, 42, 72, 75, 80] 난수 중에서 가장 큰 값 : 80 Q. 1~100 사이의 정수 난수 10개 중에서 5의 배수의 개수와 합계 평균을 출력하라 import random ran_number = [] ran_number..