https://www2007.org/papers/paper391.pdf

関連研究

知識表現の例としてRDFSやOWLなどがある。以下参考文献参照

https://www.sti-innsbruck.at/sites/default/files/Knowledge-Representation-Search-and-Rules/Russel-&-Norvig-Inference-and-Logic-Sections-7.pdf

https://static.aminer.org/pdf/PDF/000/003/026/on_to_knowledge_methodology_otkm.pdf

これらの知識表現はおもに自動で収集する手法であり、質が良くないという点がある。

この問題を解決するために、手動で知識表現を獲得する手法である。これらの手法には、WordNet [10], Cyc or OpenCyc [17], SUMO [18],などがある。

[10]https://www.jstor.org/stable/pdf/417141.pdf

[17]https://mdsoar.org/bitstream/handle/11603/11265/AAAI06SS-SyntaxAndContentOfCyc.pdf?sequence=1

[18]https://www.ontologyportal.org/professional/FOIS.pdf

YAGOでの提案

YAGOでは新しいオントロジーを提供している。このオントロジーでは最も包括的な辞書であるWikipediaを使用している。しかしWikipediaの知識そのものを情報抽出することによって知識表現を獲得するのではなく、Wikipediaのカテゴリーページを使用して構築している。カテゴリーページはある特定のカテゴリに属するページである。例えば、ジダンはフランスのサッカー選手というカテゴリーに属している。

これらのリストから実体の候補、概念の候補、関係の候補を抽出する。例えば、実体の候補としてZidaneを抽出し、概念の候補としてIsA(Zidane, FootballPlayer)を抽出し、関係の候補として(isCitizenOf(Zidane, France))を抽出する。オントロジーでは、概念は分類構造を持って配置されるべきである。Wikipediaも階層構造をもって配置されているがオントロジーの観点では、十分ではない。例えば、WikipediaでZidaneは”football in france”というスーパーカテゴリに属するがZidaneはFootballではなくFootball playerである。このようにWikipediaの階層構造ではオントロジーで必要となる分類構造を持っていない。そこで、YAGOではWikipediaのカテゴリーとWordNetの分類構造をむすびつける手法を提案している。