Data Science

·Data Science
csv 파일을 다운로드 받았는데 위와 같이 한글이 이상하게 깨져있는 오류를 자주 마주한다.그래서 기록해두는 간단한 해결 방법! 먼저 오류가 발생하는 csv 파일에서 마우스 우클릭 > 메모장에서 편집 클릭  그러면 이렇게 제대로 한글이 나오는 모습을 볼 수 있는데,여기서 위에 메뉴 중 가장 왼쪽의 [파일] > [다른 이름으로 저장] 클릭   인코딩 방식을 UTF-8 에서 UTF-8(BOM) 으로 변경 후 저장이미 존재하여 덮어씌우겠냐고 물어보는데, [예] 클릭  다시 들어가보면 이렇게 오류가 해결된 것을 볼 수 있다!
·Data Science
공공데이터포털에서 XML 페이지 열람하는 방법은 앞선 포스팅을 참고! https://sallysooo.tistory.com/2 1-1. 분석에 필요한 패키지 - '웹 크롤링' 또는 '웹 스크렙핑'은 웹에서 원하는 정보를 수집하는 작업 - API를 이용한 데이터 수집도 웹 크롤링의 한 가지 방법 1) requeset package를 통해 원하는 웹페이지 불러오기 2) BeautifulSoup 패키지로 파싱하여 웹페이지를 파이썬 객체로 변환, HTML 테그 정보 등을 활용하여 원하는 데이터 추출 beautifulsoup 패키지가 없다면 cmd 창에 다음 코드를 입력하여 설치할 수 있다. pip install beautifulsoup4 pip install lxml 1-2. 오픈 API를 통한 아파트매매실거래..
·Data Science
공공 데이터 포털 (https://www.data.go.kr/) 에 들어가면 나오는 첫 화면이다. 여기서 자유롭게 회원가입을 하면 되며, 절차는 간단한 인적사항 기재와 휴대폰 인증으로 구성되어 있다. 데이터찾기 > 데이터목록 에 들어가서 원하는 키워드를 검색하면 여러 개의 자료가 나오는데, 그 중에서 오픈 API에서 이용할 수 있는 목록도 나타난다. 나는 API를 이용하여 공공데이터포털에서 주택거래 실거래가 데이터를 수집하고자 하므로 이를 눌러보자. 찾고자 하는 아파트매매 실거래 자료에 대한 오픈 API를 이용하기 위해서는 먼저 개발계정 신청을 해야한다. 활용 목적으로 원하는대로 간단히 적으면 자동 승인처리 된다. 신청이 승인되면 오픈 API를 이용할 수 있는 인증키 발급 여부와 인증키 내용은 "마이페이..