비정형데이터분석(강필성교수님)(2)-텍스트 데이터 수집/전처리, 토큰, 멱함수 법칙, Stop-words, Lemmatization, 텍스트 변환, TF-IDF, 분산 표상, One-hot-vector, 특성 선택/추출, 잠재 의미 분석, 분류, 군..
텍스트 마이닝 프로세스 1 : 수집과 전처리 데이터를 수집하고 전처리하는 단계? 무엇을 마이닝 할 것인가 무엇을 분석 할 것인가 목적이 무엇인지 데이터가 어디에 있는지 데이터를 합법적으로 api를 통해서 받을 수 있는지 또는 스크래핑을 해야 하는지 데이터베이스 자체를 연결시켜서 접속할 수 있는지 알아보는 단계 텍스트 데이터 원천? 이메일, 메세지, 블로그, 뉴스기사, 리서치 페이퍼, 책, 내부 문서, 웹 마이닝 다양한 데이터셋? https://www.analyticsvidhya.com/blog/2018/03/comprehensive-collection-deep-learning-datasets/ https://blog.cambridgespark.com/50-free-machine-learning-datas..
2020. 3. 26.