Document Semantic Connector
ライセンス
:
Document Semantic Connectorは、複数のPDF文書における概念の関係を、知識グラフの形でネットワークとして可視化し、マインドマップのように公開できるアプリケーション作品です。ユーザーは「トピックスペース」という文書を集めるためのスペースを自由に作成し、アップロードした文書をトピックスペースに追加することで、トピック全体でどのような概念が扱われているかをネットワーク上で視覚的に把握できます。たとえば、複数の関連する文献をトピックスペースにまとめ、可視化されたネットワークを通じて、どのような概念が多く取り上げられているか、またその概念に対してどのような言及がなされているかを、ノードとリンクを使って確認することが可能です。
PDF文書から概念の関係を抽出するプロセスには、大規模言語モデル(LLM)を用いています。近年のLLMの性能向上により、自然言語から知識グラフを自動的かつ正確に構築できるようになりました。本作品では、単一のPDF文書から概念グラフを一度構築した後、さらに文書を同じトピックスペースに追加することで、それぞれのグラフを統合できる設計になっています。統合の際には、同じ単語ベースでノードが結びつくように処理されます。
本作品は、LLMを用いた概念の抽出と、複数の文書にまたがる概念の可視化を自由かつ迅速に行うことを可能にし、特定のトピックに関連する文献の中心的なテーマや言及内容を把握することをサポートします。たとえば、歴史上の人物や作家に関する記述を集めて、言及されている話題や未言及の話題を探索したり、特定の分野の研究論文を集めて、その分野の全体像を把握したりするシーンにおいて、有効な概念可視化ツールとして機能します。
【可視化の例:シビック・クリエイティブ・ベース東京[CCBT]のリサーチ記事の内容可視化】
下記リンクより閲覧可能
https://graph-viz-llm.caric.jp/topic-spaces/cm22vl5yc0000tjxeaelnf78a/graph
参考記事一覧
・CCBTと⼤学・研究機関との協働事業「情報保障⽀援調査研究プロジェクト」, https://ccbt.rekibun.or.jp/research-notes/diverstiy-and-inclusion-project-01
・Future Ideations Camp Vol.2|setup():ブロックチェーンで新しいルールをつくる, https://ccbt.rekibun.or.jp/research-notes/camp2_setup
・ 世界のラボ型⽂化拠点リスト, https://ccbt.rekibun.or.jp/research-notes/hello_lab
・TMPR「AIが⾒てきた⾵景を辿る⼈⼯知能紀⾏」, https://ccbt.rekibun.or.jp/research-notes/tmpr_report
・contact Gonzo「bintaの深層」, https://ccbt.rekibun.or.jp/research-notes/binta_no_shinso
・みんなのノート|「アート&テクノロジーへの問い」第1回「⼈間として⽣きる」, https://ccbt.rekibun.or.jp/research-notes/artandtechnology01
更新: 2024年10月13日