짧은 요약(Abstract) :
* BERN2 제안하여 BIO NER, NEN 성능 개선
Paper with my notes
Lecture link
단어정리
- collate: 대조하다, 맞추어 보다, 함께 합치다
1 Introduction
- Biomedical 텍스트마이닝 중요(관련 텍스트 지속 증가)
** biomedical entity(gene/protein/disease) 또한 지속 증가
** bio NER, NEN(named entity normalization) 에 사용 가능
- 기존 것 약점 3가지 있음
** 1. 엔티티 타입 적음(5)
** 2. 모델마다 annotation 다름
** 3. slow
- BERN 제안
** 9가지 biomedical entity types
** reduce annotation time
** combine rule-base and neural network based NEN -> improve the quality of NEN
</br>
2 Materials and methods
2.1 Multi-task named entity recognition
- NER 여러개 멀티태스크러닝으로 돌려서 빠름
** BC2GM - gene/protein
** NCBI-disease - disease
** BC4CHEMD - drug/chemical
** Linnaeus - species
** JNLPBA - cell line, cell type, DNA, and RNA
2.2 Hybrid named entity normalization