목록해외 주식 분석 프로젝트 (10)
GOOD4ME

Z검정 | Z분포 모집단이 정규분포이고 모분산(모집단의 표준편차)을 알고 있을 경우 표본개수(N)이 30개 이상일 때 -> Z검정을 실시, Z분포 사용 N이 30개 미만일 때 -> 정규성 테스트 통과 시, Z검정을 실시, Z분포 사용 -> 정규성 테스트 불통 시, 비모수적 방법 사용 T검정 | T분포 모집단이 정규분포이나 모분산(모집단의 표준편차)를 모르는 경우 표본개수(N)이 30개 이상일 때 -> T검정을 실시, T분포 사용 N이 30개 미만일 때 -> 정규성 테스트 통과 시, T검정을 실시, T분포 사용 -> 정규성 테스트 불통 시 , 비모수적 방법 사용 예제) 더보기 A는 매일 아침 식빵 구매. 식빵 무게는 500g. 빵이 500g인지 의구심. 일주일동안 식빵 무게 기록.495g, 496g, 50..

해외 주식 지표 데이터 크롤링을 완료한 후, 각 지표의 변화량이 얼마나 되는지 시각화할 필요가 있다고 느꼈다. 데이터의 볼륨은 1 row per day, 13개의 항목, 12개의 종목. 하루에 1*13*12 = 156개의 value 데이터가 쌓이므로 많은 컴퓨팅 자원 없이 적재가 가능할 것으로 예상된다. 데이터 수집은 BeautifulSoup를 사용하여 핀비즈에서 이루어질 것이다. 더보기 이미 몇 건의 데이터를 수집한 이력이 있지만, 다른 웹에서 크롤링한 데이터이기 때문에, 그리고 크롤링한 데이터 몇 가지가 다르기 때문에, 기 수집한 데이터는 사용하지 않을 예정이다. 데이터의 적재는 Ubuntu에 기 구축한 Docker 기반의 InfluxDB를 통해 이루어질 것이다.

지표 데이터 크롤링 기술이 확정되었고, 확정한 기술을 통해 크롤링 테스트를 완료하였다. 이번 테스트 및 작업에 대해 설명하기 전, 지표데이터 수집의 대상이 되는 사이트를 변경했음을 알린다. 야후파이낸스는 필요한 지표들이 여러 페이지(탭)에 나뉘어져있었고, 이번에 선정한 사이트는 필요한 지표들이 하나의 표 안에 통합되어있어 더 신속하고 효율적인 크롤링을 할 수 있었다. 크롤링 기술 변경 selenium 👉 BeautifulSoup 지난 포스팅에서 언급했듯이 웹에서 입력자동화가 필요없는 이상, BeautifulSoup를 사용하는 것이 크롤링 속도가 더 빠르기 때문에 변경하였다. 사용한 구문 설명 # request.get 하위 함수 raise_for_status() """ 요청/응답 코드가 200이 아니면 예..

주가와 어떤 상관관계가 있는지 확인 필요 이번 프로젝트에서 수집하는 지표 데이터는 하단과 같다. 모든 지표가 반드시 주가와 관련있기 때문에 수집한 것은 아니다. 예를 들어 "last_split_date" 또는 "previous_close" 같은 지표를 말하는 것이다. 그렇다면 어떤 지표가 분석에 효과적인가? 반드시 정답은 아니지만, 필자의 생각에 따라 수집한 지표 중, 분석에 유의미한 것을 하단에 정리해보았다. 1. total_debt_equity_mrq 🎈당연히 비율이 클수록 부정적인 요소 야후 파이낸스 정식 지표명 👉 Total Debt/Equity (mrq) 총 자기 자본 대비 부채 비율 2. total_cash_per_share_mrq 🎈단순히 값만 보고는 유의미한 분석 불가능 🎈이전보다 낮아질수..