목록파이썬 & AI 학습 (22)
A.I
딥러닝¶ 1. 신경망 구성¶MNIST 모델¶ In [2]: import tensorflow as tf from tensorflow import keras import numpy as np import matplotlib.pyplot as plt # MNIST 데이터를 로드 mnist = keras.datasets.mnist (x_train, y_train), (x_test, y_test) = mnist.load_data() # 모델에 맞게 데이터 가공 x_train_norm, x_test_norm = x_train / 255.0, x_test / 255.0 x_train_reshaped = x_train_norm.reshape(-1, x_train_norm.shape[1]*x_train_norm.shap..
이상치 탐색¶ 주가 데이터 분석¶ pip install requests mkdir -p ~/aiffel/anomaly_detection/kospi In [4]: import requests import os # 아래 url은 yahoo finance 서버에 우리나라 코스피 데이터를 요청하는 주소입니다. url = "https://query1.finance.yahoo.com/v7/finance/download/%5EKS11?period1=867715200&period2=1597276800&interval=1d&events=history" # 데이터를 요청하고 그 결과를 response로 받습니다. response = requests.get(url) csv_file = os.getenv('HOME&#..
데이터 가져오기¶ 소켓통신¶ In [1]: import socket with socket.socket(socket.AF_INET, socket.SOCK_STREAM) as s: # 소켓 s를 하나 열어서 s.connect(('www.google.com', 80)) # www.google.com 이라는 호스트의 80번 포트에 접속합니다. cmd = 'GET http://www.google.com HTTP/1.0\r\n\r\n'.encode() s.send(cmd) # 접속이 되면 GET xxxxx 형식의 HTTP 프로토콜로 된 명령을 전송합니다. data = s.recv(1024) # 그리고 1024바이트만큼의 HTTP 응답을 수신합니다. print('Received:&..
회귀(Regression)¶ 1. 선형 회귀 분석(Linear Regression)¶ 종속변수 Y와 한 개 이상의 독립변수 X와의 선형 상관관계를 모델링하는 회귀분석 기법 주어진 데이터에 우리의 선형 식이 잘 맞도록 회귀계수 및 오차를 구하는 것 머신러닝에서의 선형회귀모델 H = Wx + b 가정(Hypothesis), 가중치(Weight), 편향(bias) 손실함수 중 최소제곱법이란 n 개의 점 데이터에 대하여 잔차의 제곱의 합을 최소로 하는 W, b를 구하는 방법 잔차란 회귀모델을 이용해 추정한 값과 실제 데이터의 차이를 뜻함. 회귀모델이 잘 결정되었는지 R2-Score를 통해 알 수 있음(1에 가까울수록 회귀모델이 데이터를 잘 표현하고 있음) 1-1. 최소제곱법¶ In [2]: # boston ho..
데이터 전처리¶ mkdir -p ~/aiffel/data_preprocess/data wget https://aiffelstaticprd.blob.core.windows.net/media/documents/trade.csv mv trade.csv ~/aiffel/data_preprocess/data trade.csv는 관세청 수출입 무역통계 데이터 In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt print("👽 Hello.") 👽 Hello. In [10]: import os csv_file_path = os.getenv('HOME')+'/aiffel/data_preprocess/data/t..
파이썬 문법¶ In [3]: import time start = time.time() # 시작 시간 저장 a = 1 for i in range(100): a += 1 # 작업 코드 print("time :", time.time() - start) # 결과는 '초' 단위 입니다. time : 0.0005440711975097656 for문¶ In [4]: my_list = ['a','b','c','d'] for i in my_list: print("값 : ", i) 값 : a 값 : b 값 : c 값 : d In [5]: # 리스트, 문자열, 튜플 등이 있는 경우 순서와 리스트의 값을 함께 반환 my_list = ['a'..
비지도 학습(Unspervised Learning)¶ 1. 클러스터링 K-means¶ 1-1. 데이터생성¶ In [1]: %matplotlib inline from sklearn.datasets import make_blobs import pandas as pd import numpy as np import matplotlib.pyplot as plt import random # 중심점이 5개인 100개의 점 데이터를 무작위로 생성합니다. points, labels = make_blobs(n_samples=100, centers=5, n_features=2, random_state=135) print(points.shape, points[:10]) # 무작위로 생성된 점의 좌표 10개 출력 print(l..
포켓몬 찾기¶ 1. 포켓몬 데이터 구하기¶ https://www.kaggle.com/abcsds/pokemon mkdir -p ~/aiffel/pokemon_eda/data wget https://aiffelstaticprd.blob.core.windows.net/media/documents/Pokemon.csv mv Pokemon.csv ~/aiffel/pokemon_eda/data 2. 데이터 불러오기¶ In [1]: import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline %config InlineBackend.figure_format = 'retin..