Python(5)
-
ValueError: Found input variables with inconsistent numbers of samples 해결하기(train_test_split)
데이터를 가지고 모델을 학습시키고 있는데 에러를 만나게 되었다. 복잡한 코드도 아니었기에 당황스러웠으나 일단 살펴보았는데 1.에러 내용 아래와 같은 매우 긴 에러글을 만나게되었다. --------------------------------------------------------------------------- ValueError Traceback (most recent call last) Cell In [45], line 3 1 mlr=LinearRegression() ----> 3 mlr.fit(x_train, y_train) File ~\anaconda3\envs\keyword\lib\site-packages\sklearn\linear_model\_base.py:684, in LinearRegr..
2022.11.07 -
os.path.join 파일 경로 설정하기
os는 파일들을 작업하는데 있어서 많은 도움들을준다. 특히 그중에서 path.join에 대하여 알아보고자 한다. 우선 들어가기 전에 os를 import 해야한다는 것을 잊지말자. 1. 일반적인 경로설정 일반적으로 자신이 원하는 파일의 경로가 있다면 file_path= '/content/drive/MyDrive/Project/korean/' file_name='output_data.py' full_path=file_path + file_name 혹은 file_path = '/content/drive/MyDrive/Project/korean/output_data.py' 위의 경우와 같이 file path와 file name을 구분지어서 설정 후 합하거나 처음부터 모든 경로를 다 입력하여 사용할 것이다. 사실..
2022.10.19 -
Python pandas excel .xlsx .csv 불러오기 저장
python에서도 엑셀 파일을 활용 할 수 있지만 pandas를 활용한다면 더쉽게 사용할 수 있다. 우선 pandas를 import 해주고 시작하는데 colab환경이 아니거나 이전에 활용한 적이 없다면 'xlrd' 와 'openpyxl' 을 먼저 설치하고 진행하도록 하자. >>> import pandas as pd 1. csv 읽기(불러오기) >>> data = pd.read_csv('file path+filename') csv파일을 읽어오는 것은 간단하다. 변수(data)를 선언하여 read_csv로 파일의 경로를 입력해 주면 끝이다. 여기에서 보충하자면 로컬환경일 때 inpy나 py파일과 같이 있을 경우 file name만 기재해도 불러올 수 있으나, 다른 폴더에 있을 때는 file path를 기재해..
2022.10.11 -
Python range vs arange 차이
Python을 사용하다보니 이름이 비슷한 녀석들이 많다. range와 arange는 a하나 차이이며 심지어 작용하는 것도 비슷한데 다르다. 1. range >>>range(1, 4) range(1, 4) >>>list(range(1, 4, 1)) 1 2 3 >>>range(1, 4, 1.1) Type Error range(1, 4)를 입력하면 위와 같이 range(1, 4)가 출력되어서 list로 만들어서 출력하였다. range(시작, 끝, step)으로 구성되며 끝 숫자는 출력되지 않고 시작 숫자부터 step에 따라 출력된다. (step은 기본적으로 1) int만 이용이 가능하며 float을 입력할 경우 type error을 만날 수 있다. 2.arange >>>np.arange(1, 4, 1) arr..
2022.10.06 -
Python 문자 정렬 ljust(), rjust(), center()
Python을 사용하다보면 문자열 데이터를 정렬해야 할 경우가 있다. 이때에 사용할 수 있는 방법이 ljust(), rjust(), center()이다 우선 우리는 아래의 sample을 정렬할 필요가 있다고 가정하고, sample ='good day' 1. ljust() - 왼쪽 정렬 >>> sample.ljust(10) 'good day ' ()안의 숫자는 총 글자수 이다. sample의 'good day'는 띄어쓰기까지 8글자인데 이를 넘는 10을 씀으로써 'good day '가 완성 되었다. 만약, ()안에 sample보다 적은 글자수를 입력하면 어떻게 될까? >>> sample.ljust(3) 'good day' 위와 같이 3을 입력했을 때 sample이 그대로 출력되는 것을 확인할 수 있다. 2..
2022.09.28