12
자동으로 세줄 요약을 해드립니다 Summariz3 개발기 PyCon APAC 2016 Lightning Talk Jamie Seol SNU IDS Lab.

Summariz3 개발기

Embed Size (px)

Citation preview

Page 1: Summariz3 개발기

자동으로����������� ������������������  세줄����������� ������������������  요약을����������� ������������������  해드립니다����������� ������������������  

Summariz3����������� ������������������  개발기

PyCon����������� ������������������  APAC����������� ������������������  2016����������� ������������������  Lightning����������� ������������������  Talk����������� ������������������  Jamie����������� ������������������  Seol����������� ������������������  

SNU����������� ������������������  IDS����������� ������������������  Lab.

Page 2: Summariz3 개발기

my����������� ������������������  love,����������� ������������������  django!����������� ������������������  

summariz3.herokuapp.com

Page 3: Summariz3 개발기

파이콘����������� ������������������  성명서

[5]

Page 4: Summariz3 개발기

[6]

Page 5: Summariz3 개발기

허억

[8] [9]

Page 6: Summariz3 개발기

사실����������� ������������������  낡은����������� ������������������  알고리즘이고����������� ������������������  비슷한게����������� ������������������  이미����������� ������������������  많이����������� ������������������  있습니다

[1]

Page 7: Summariz3 개발기

TextRank

• just����������� ������������������  PageRank!����������� ������������������  

• a����������� ������������������  sentence����������� ������������������  gains����������� ������������������  more����������� ������������������  rank����������� ������������������  if����������� ������������������  important����������� ������������������  sentence����������� ������������������  refers����������� ������������������  

• refers?����������� ������������������  

• hypothesis:����������� ������������������  sentences����������� ������������������  sharing����������� ������������������  nouns����������� ������������������  refers����������� ������������������  each����������� ������������������  other

[7]

Page 8: Summariz3 개발기

논문

[4]

Page 9: Summariz3 개발기

Future����������� ������������������  works

• improve����������� ������������������  textrank����������� ������������������  (change����������� ������������������  edge����������� ������������������  weight����������� ������������������  function)����������� ������������������  

• neural����������� ������������������  network����������� ������������������  based����������� ������������������  summarization?����������� ������������������  [2, 3]

Page 10: Summariz3 개발기

Textrankr

• detailed����������� ������������������  explanation:����������� ������������������  on����������� ������������������  my����������� ������������������  blog����������� ������������������  (blog.theeluwin.kr)����������� ������������������  

• source����������� ������������������  code:����������� ������������������  github.com/theeluwin/textrankr����������� ������������������  

• PR����������� ������������������  please!����������� ������������������  

• you����������� ������������������  can����������� ������������������  use����������� ������������������  it����������� ������������������  right����������� ������������������  now����������� ������������������  via����������� ������������������  PyPI

pip  install  textrankr  ——  from  textrankr  import  TextRank  textrank  =  TextRank(your_text_here)  print(textrank.summarize())

Page 11: Summariz3 개발기

References

1. Mihalcea, Rada, and Paul Tarau. “TextRank: Bringing order into texts.” Association for Computational Linguistics, 2004.

2. Kaikhah, Khosrow. “Automatic text summarization with neural networks.” (2004). 3. Svore, Krysta Marie, Lucy Vanderwende, and Christopher JC Burges. “Enhancing

Single-Document Summarization by Combining RankNet and Third-Party Sources.” EMNLP-CoNLL. 2007.

4. Bahdanau, Dzmitry, Kyunghyun Cho, and Yoshua Bengio. “Neural machine translation by jointly learning to align and translate.” arXiv preprint arXiv:1409.0473 (2014).

5. https://www.pycon.kr/2016apac/ 6. https://namu.wiki/w/%EB%8F%8C%EB%A1%9C%EB%A0%88%EC%8A

%A4%20%EC%97%84%EB%B8%8C%EB%A6%BF%EC%A7%80 7. http://blog.theeluwin.kr/post/146188165713/summariz3 8. http://sports.khan.co.kr/news/sk_index.html?art_id=201606221136003&sec_id=562901 9. http://www.insight.co.kr/newsRead.php?ArtNo=65634

Page 12: Summariz3 개발기

Thank you!

follow me at twitter! @theeluwin