11 둘째 :  
*논문 복습  보강 with nlp 자료  
*모델링  
*REC-SYS  
*CODE  
*기타  -eng, app  

2021년 11월 08일 월요일
*논문
**Attention Is All You Need 복습
*CODE
**h-r array01
*기타
**app
*모델링
**CLNER 발굴?
*REC-SYS
*이웃기반 CF
o

2021년 11월 09일 화요일
논문
**CLNER 읽기 시작
*모델링
**kifrs 자료 & kgaap 자료 수집
**
http://www.kasb.or.kr/fe/accstd/NR_list.do;jsessionid=C4765A34282A020F46705B8B70A2C789?sortCd=K-IFRS&divCd=01 여기가 삼일 보다 다운받기 쉬움
*fasttext 돌려봐야지.. gensim?
**
pdf file일단 text로 refine
***돌려봤는데 뭔가 vocab에 문제가 있음.. unseen 처리 못 하는 것이야 생각했던 거지만 뭔가 token 이상하게 짤린 듯? 내일 체크해봐야.. *CODE
**h-r array02
*기타 -eng, app
*REC-SYS
**모델기반 associate rule mining
o

2021년 11월 10일 수요일
*논문
**experiments 전까지..
*모델링
**gensim fastext 학습에 맞는 형태로 바꿔줌. 문장을 token 단위의 list로 주어야함
**근데 띄워쓰기만 해줄 경우 아무래도 임베딩 퀄리티가 떨어져서.. 전처리 해줘야함
*CODE
**h-r array03 푸는중.. 좀 어렵네
*기타 -eng, app
*REC-SYS
**MF, SVD
o

2021년 11월 11일 목요일
*논문
한장 남움..
*CODE
**후우 왜렇게 어렵지.. 진전 조금 있었지만.. 아직 못 품
*기타 -eng, app
*CODE 정리
**는 못 하구.. 사전문제랑 홀수문제 봄ㅠ
*REC-SYS
**SGD, ALS 이용
o
*모델링

2021년 11월 12일 금요일
논문
**다 읽고 정리
*CODE
**어제 문제 결국 답을 봄.. 어렵고도 쉬운 array문제였음
*기타 -eng, app
*모델링
**OWL
*REC-SYS
**implicit, explicit feedback
**
정성, 정량평가 느낌

o

REC
*이웃기반 (유저-아이템) CF
**구현 간단 model base CF보다 계산 적고 새유저-아이템에 대해 안정적
**대신 콜드스타트문제와 데이터 많아질수록 계산량 문제, 롱테일 이코노미문제(소수 아이템 쏠림 현상)의 단점이 있음

*자카드 유사도
**교집합/합집합 ->얼마나 많은 아이템이 겹치는지 판단
*피어슨 유사도
**코사인 유사도와 유사. 정규화가 추가됨. 1은 양의상관관계, -1은 음의상관관계, 0은 상관관계 없음