翻譯社自然說話處置(英語:Natural Language Processing,簡稱NLP)是人工聰明和說話學範疇的分支學科翻譯在這此範疇中切磋如何處置懲罰及應用自然說話;天然說話認知則是指讓電腦「懂」人類的語言翻譯
任務和限制[編纂]
現實問題[編纂]
[1] 第一,傳統的基於句法-語義法則的理性主義方法遭到質疑,跟著語料庫扶植和語料庫說話學的突起,大規模真實文本的處置懲罰成為天然語言處置懲罰的首要計謀目的。
第二,統計數學方式越來越遭到正視,天然語言處置懲罰中愈來愈多地利用機械自動進修的方式來獲得語言常識。
天然說話生成系統把較量爭論機數據轉化為自然說話翻譯自然語言理解系統把天然說話轉化為較量爭論機法式更易於處置懲罰的情勢翻譯
相關實例[編輯]
- GATE: a Java Library for Text Engineering
- LTP:說話手藝平台(簡體中文)
- MARF
- Python編程說話的天然語言處置懲罰工具包教程
- FudanNLP開源中文天然說話處置對象包
參見[編纂]
延長浏覽[編纂]
- Bates翻譯社 M. Models of natural language understanding. Proceedings of the National Academy of Sciences of the United States of America. 1995, 92 (22): 9977–9982. doi:10.1073/pnas.92.22.9977.
- Steven Bird, Ewan Klein, and Edward Loper (2009). Natural Language Processing with Python. O'Reilly Media. ISBN 978-0-596-51649-9.
- Daniel Jurafsky and James H. Martin (2008). Speech and Language Processing, 2nd edition. Pearson Prentice Hall. ISBN 978-0-13-187321-6.
- Christopher D. Manning, Prabhakar Raghavan, and Hinrich Schütze (2008). Introduction to Information Retrieval. Cambridge University Press. ISBN 978-0-521-86571-5. Official html and pdf versions available without charge.
- Christopher D. Manning and Hinrich Schütze (1999). Foundations of Statistical Natural Language Processing. The MIT Press. ISBN 978-0-262-13360-9.
- David M. W. Powers and Christopher C. R. Turk (1989). Machine Learning of Natural Language. Springer-Verlag. ISBN 978-0-387-19557-5.
外部連結[編輯]
- 人類說話手藝當前成長情況概覽
- 哥倫比亞大學自然語言處理研究組
- 卡內基梅隆大學語言技術研究院
- 斯坦福大學天然說話處置研究小組
- 中文自然語言處理開放平臺
- ACL(美國電腦說話學協會)供給的相幹雜誌和鑽研會的論文
|
|
第四,天然語言處置中越來越正視詞彙的感化,出現了強烈的「辭彙主義」的偏向。辭彙常識庫的建造成為了遍及關注的問題。這使得研究員們對此系統相當樂觀,但是,當把這個系統拓展到佈滿了現實世界的模糊與不肯定性的情況中時,他們很快損失了決心信念。
初期的語言處置懲罰系統如SHRDLU,當它們處於一個有限的「積木世界」,應用有限的詞彙表會話時,工作得相當好。理論上,NLP是一種很吸引人的人機交互體例。
目次
- 1 義務和限制
- 2 現實問題
- 3 天然說話處置懲罰的首要範圍
- 4 天然說話處置研究的難點
- 4.1 單詞的邊界界定
- 4.2 詞義的消歧
- 4.3 句法的恍惚性
- 4.4 有瑕疵的或不規範的輸入
- 4.5 說話行為與企圖
- 5 當前天然說話處置懲罰研究的成長趨向
- 6 統計天然說話處理
- 6.1 相幹實例
- 7 拜見
- 8 延長浏覽
- 9 外部貫穿連接
統計自然說話處置運用了推斷學、機率、統計的方式來解決上述,尤其是針對輕易高度恍惚的長串句子,當套用現實文法進行分析產生出成千上萬筆可能性時所激發之困難。
處置懲罰這些高度恍惚句子所採用消歧的方式通常運用到語料庫和馬可夫模型(Markov models)。一些NLP面臨的問題實例:
第三,淺層處理與深層處置並重,統計與規則方式並重,形成混合式的系統。
同時,在自然語言處理中,"理解"的定義也變成一個首要的問題。由於理解(understanding)天然說話,需要關於外在世界的普遍知識和應用操作這些常識的能力,自然說話認知,同時也被視為一小我工智慧完備(AI-complete)的問題。
語言行為與設計[編輯]
- 句子經常其實不只是字面上的意思;例如,「翻譯公司能把鹽遞過來嗎」,一個好的回覆該當是著手把鹽遞曩昔;在大多半上下文情況中,「能」將是糟的回答,雖然說回覆「不」或者「太遠了我拿不到」也是可以接管的。
- 句子「天成翻譯社們把香蕉給山公,因為(牠們)餓了」和「我們把香蕉給山公,因為(它們)熟透了」有一樣的構造。(英文的it沒有辨別,但在中文裡「牠」和「它」是有區分的,只是代詞在中文裡常常被省略,是以需區分屬性而且標示出來)
自然說話處置懲罰的首要領域[編纂]
- 文本朗誦(Text to speech)/語音合成(Speech synthesis)
- 語音辨認(Speech recognition)
- 中文自動分詞(Chinese word segmentation)
- 詞性標註(Part-of-speech tagging)
- 句法闡明(Parsing)
- 天然說話生成(Natural language generation)
- 文本分類(Text categorization)
- 信息檢索(Information retrieval)
- 信息抽取(Information extraction)
- 文字校訂(Text-proofing)
- 問答系統(Question answering)
- 給一句人類說話的問定,決意其答案翻譯 典型問題有特定答案 (像是加拿大的首都叫什麼?),但也斟酌些開放式問句(像是人生的意義是是甚麼?)
- 將某種人類說話主動翻譯至另一種語言
- 產生一段文字的大意,每每用於供應已知領域的文章摘要,例如產生報紙上某篇文章之摘要
自然說話處置懲罰研究的難點[編纂]
單詞的邊界界定[編纂]
- 在口語中,詞與詞之間凡是是連貫的,而界定字詞鴻溝平常使用的門徑是取用能讓給定的上下文最為通順且在文法上無誤的一種最佳組合翻譯在書寫上,漢語也沒有詞與詞之間的鴻溝翻譯
詞義的消歧[編纂]
句法的恍惚性[編纂]
- 天然語言的文法通常是模稜兩可的,針對一個句子每每可能會理會(Parse)出多棵剖析樹(Parse Tree),而我們必需要仰賴語意及前後文的資訊才能在其中選擇一棵最為合適的理會樹。再者,若是一門課程去年沒開設,對於發問「這門課程客歲有幾多學生沒經由過程?」回答「客歲沒開這門課」要比回覆「沒人沒通過」好。但是代詞「它們」在第一句中指的是「山公」,在第二句中指的是「香蕉」。
有瑕疵的或不規範的輸入[編輯]
- 例如語音處理時遇到外國口音或處所口音,或在文本的處置中處置拼寫,語法或光學字元識別(OCR)的毛病。
當前自然說話處置懲罰研究的發展趨向[編纂]
假如不領會猴子和香蕉的屬性,沒法辨別。統計天然說話處置懲罰[編輯]
本文來自: https://zh.wikipedia.org/wiki/%E8%87%AA%E7%84%B6%E8%AA%9E%E8%A8%80%E8%99%95%E7%90%86有關翻譯的問題歡迎諮詢天成翻譯社
留言列表