본문 바로가기

Python61

[로또] 이번 회차 로또 1등 번호에 직전 회차 1등 번호가 나올 확률은? 안녕하세요. 인문계공돌이입니다. 오늘도 로또 이야기를 들고 왔습니다. 궁금한 것은 이번 회차 로또 1등 번호에 직전 회차 1등 번호가 몇 개나 겹치는지 입니다. 참고로 로또 관련 한 것은 재미로만 봐주시길 바랍니다. 로또 중복 설계 필요한 라이브러리를 불러왔습니다. 이중 tqdm은 반복문의 진행사항을 알려주기 위해서 사용합니다. pickle은 971회차를 불러오고 저장하는 시간이 오래 걸려 새로운 회차가 나올 때마다 반복문을 실행시키지 않고 리스트를 저장해서 여기에 추가만 해주는 식으로 하기 위해 사용합니다. 각 회차의 로또 1등 번호를 추출하는 코드입니다. 예를 들어 972회차 결과를 보면 위의 결과가 나오는데 실제 972회 당청결과가 잘 저장이 됩니다. 이제 반복문을 통해 971회까지의 결과를 lot.. 2021. 7. 25.
[키움증권 API] 주식 매매를 위한 환경 구축 Python 안녕하세요. 인문계공돌이입니다. 오늘은 키움증권 API를 이용하여 주식 정보를 불러오는 방법을 소개할텐데 중간에 겪었던 시행착오도 모두 설명드리겠습니다. 키움 증권 API 사전 작업 키움증권 홈페이지에서 필요한 프로그램을 먼저 다운로드 받아야 합니다. 홈페이지에 가면 사용절차가 자세히 나와있습니다. 먼저 로그인을 해서 Open API 사용신청을 했습니다. 두 번째로 Open API+ 모듈을 다운 받았습니다. KOA Studio를 다운 받았습니다. 압축 파일안에 2개의 파일이 있는데 이것을 키움 Open API+ 모듈 경로에 붙여 넣기 해줘야 합니다 경로를 바꾸지 않았다면 C 드라이브 안에 OpenAPI 폴더가 있고 그 안에 넣으면 됩니다. 이제 모의투자만 신청하면 됩니다. 저는 자동매매는 하지 않고 종목.. 2021. 7. 24.
[데이터 가공, 정규표현식] G마켓 농심 라면 데이터 가공하기 Python 안녕하세요. 인문계공돌이입니다. 저번에 G마켓 사이트에서 라면 데이터를 수집했는데 분석을 할 수 있는 데이터로 가공해보겠습니다. 데이터 가공 with 정규표현식 가공에 필요한 라이브러리부터 불러왔습니다. 데이터를 보고 다음과 같은 전처리를 해야겠다는 생각이 들었습니다. 브랜드 변수에서 제품 이름 추출하기 만족도 변수에서 숫자만 추출하기 만족도참여 괄호 안 숫자만 추출하고 쉼표 없애기 구매건수 숫자만 추출하고 쉼표 없애기 위 작업이 먼저 떠올랐습니다. 먼저 브랜드 변수에서 육개장, 신라면 등만 추출해서 새로운 변수 '종류'에 넣었습니다. 만약 브랜드가 농심 밖에 적혀 있지 않다면 농심 그대로 종류에 넣었습니다. 다음으로는 만족도에서 숫자만 뽑았습니다. 정규표현식을 사용하여 %앞에 있는 숫자만 뽑았습니다. .. 2021. 7. 23.
[크롤링] G마켓 농심 라면 데이터 수집 Python 안녕하세요. 인문계공돌이입니다. 오늘은 G마켓 사이트에서 농심 라면 데이터를 수집하기 위해 크롤링을 해보겠습니다. 크롤링 허용 여부 홈페이지 링크 뒤에 /robots.txt를 붙여 확인한 결과 Allow 즉, 크롤링이 허용이 되었습니다. 크롤링 전체 카테고리에서 식품/생필품 > 가공식품으로 이동하였습니다. 라면을 선택했습니다. 검색 조건은 무료배송과 농심입니다. 다음 분석을 위해서 상품평 많은 순으로 정렬했습니다. 먼저 사용할 라이브러리를 불러 왔습니다. 수집해야 할 변수는 총 6개입니다. 브랜드, 제품명, 가격, 만족도, 만족도참여건수, 구매건수입니다. 각 변수 값을 추출하기 위해 빈리스트를 만들고 해당 태그를 넣었는데 span.text같이 겹치는 것이 보입니다. 이 경우에는 좀 더 태그 범위를 넓혀야.. 2021. 7. 22.