ハッカソン・アイデアソン成果の共有と
ビジネス化支援・人材情報の統合サイト

聴く小倉百人一首LOD

ライセンス : CC0
小倉百人一首LODは、全国各地の図書館に所蔵している古典籍の画像データや翻訳本のテキストデータをつないだデータセットである。2021年度は、小倉百人一首LODに日本語朗読および英語翻訳作品の朗読の音声データを追加した。音声データに必要な語彙の整理とかるた特有の語彙を整理し、小倉百人一首LODのデータを拡充した。
更新: 2021年11月21日

テキスト 詳細
【エントリー作品の詳細説明】 小倉百人一首LODは、全国各地の図書館に所蔵している古典籍の画像データと翻刻データ、および英語本の翻訳データを提供するデータセットである。LODチャレンジ2017において、データセット部門最優秀賞を受賞し、LODチャレンジ2018ではIIIF(International Image Interoperability Framework)を使って、画像のリンクの改善を行い、LODチャレンジ2019では英語翻訳資料のデータの追加を行った。LODチャレンジ2020では「みんなで翻刻」プロジェクトと連携してデータの翻刻データの拡充を行い、これらの継続的な活動からプログレス賞を受賞している。 2020年までのデータモデルは「小倉百人一首LODのデータモデル設計と構築」『情報の科学と技術』2021 年71 巻8 号 p. 376-381( https://doi.org/10.18919/jkg.71.8_376 )にまとめ、発表した。 今年度LODチャレンジ2021では、音声データの追加を行った。小倉百人一首には、遊びとしての知名度・人気があり、かつ和歌研究にも膨大な資料的な蓄積があるため、かるたLODとして活用された場合のインパクトが高い素材である。音声データの追加により、ゲームアプリケーション開発などにおいても、より便利なデータを提供できる。 今回の応募作品は、日本語の朗読1点(朗読者:加賀美幸子)、英語翻訳本(William N. Porter訳)の朗読1点(朗読者:Kevin Steinbach)のデータ化を行ったものである。LOD化にあたっては、音声データを上の句・下の句にわけて取得しやすいように始まりと終わりの時刻をデータ化したことや、朗読の文字起こしをした点、底本の和歌リソースとの間に相互リンクを形成した点に独自性がある。 [既存オープンデータの活用] 小倉百人一首LODは、原則としてオープンなライセンスを付与して公開されたデータを活用している。NHKクリエイティブライブラリーの日本語データと、LibriVoxの英語データを活用した。日本語データはCCBY-NC相当であるが、英語データはPublic Domainの作品を朗読し無料公開しているLibriVoxの音声データを利用しているため、本作品のオープン性は確保されている。作成したデータはCCBYで提供する。 【利用しているオープンデータ】 ・LibriVox(free public domain audiobooks)"One Hundred Verses from Old Japan"   https://librivox.org/one-hundred-verses-from-old-japan-by-teika-porter/ ・NHKクリエイティブ・ライブラリー 「音声百人一首」    https://www.nhk.or.jp/archives/creative/ 【語彙の詳細】 小倉百人一首LODに音声データのとりこみを行うため、語彙の追加を行った。以下の3つの考え方で、音声データに一般的に必要な語彙に加えて、かるたに特有の語彙を独自定義し、語彙の定義表をver.5に書き換えた。  karutaの名前空間 https://github.com/tnanako/karutalod (1)原本と音声との間は、dcterms:isFormatOfおよびdcterms:hasFormatで相互リンクする。 日本語朗読は底本が明確ではないため、小倉百人一首かるたデータと相互にリンクを形成した。英語翻訳本は既存のデータセット(William N. Porter訳One Hundred Verses from Old Japan)があるため、相互にリンクを形成した。いずれも和歌リソースの単位でのリンクである。 (2)音声データに必要な語彙は、schema.orgから採用した。   schema:transcription 朗読のテキスト   schema:readBy 読手・朗読者   schema:url ファイルのURL   schema:encodingFormat ファイル形式   schema:duration 継続時間   schema:startTime 始まりタイム   schema:endTime 終わりタイム (3)かるたに特有の語彙として、開始時間、終了時間については、上の句と下の句をわけて記録することにした。   karuta:startTimeOfFirstHalf 上の句始まりタイム   karuta:endTimeOfFirstHalf 上の句終わりタイム   karuta:startTimeOfSecondHalf 下の句始まりタイム   karuta:endTimeOfSecondHalf 下の句終わりタイム 【新規作成データ】 ・小倉百人一首のオープンデータ音声リスト http://linkdata.org/work/rdf1s8930i ・音声百人一首(NHKクリエイティブ・ライブラリー) http://linkdata.org/work/rdf1s8931i ・One Hundred Verses from Old Japan(Audio on the LibriVox) http://linkdata.org/work/rdf1s8932i 【修正作成データ】 ・小倉百人一首かるたデータ http://linkdata.org/work/rdf1s6834i   ※hasFormat に 音声データのURIを追加した。 ・English Ogura Hyakunin Isshu translated by Porter http://linkdata.org/work/rdf1s8014i   ※hasFormat に 音声データのURIを追加した。 [拡張可能性] 応募作品は、日本語朗読1点、英語翻訳の朗読1点であるが、データのモデルとしては他の作品も追加することが可能である。 [活用可能性] 音声データは上の句・下の句ごとに音声データを取得しやすいようにした。ゲームのアプリケーション開発等に活用することが可能である。 また、英語音声データには文字起こしのテキストをつけているため、外国語学習のアプリケーション開発にも資するデータとなっている。
更新: 2021年11月21日 (Nanako Takahashi)
データ 詳細
【エントリー作品】
更新: 2021年11月3日 (Nanako Takahashi)
データ 詳細
【エントリー作品】
更新: 2021年11月3日 (Nanako Takahashi)
データ 詳細
【エントリー作品】
更新: 2021年11月3日 (Nanako Takahashi)
データ 詳細
【エントリー作品】
9

評価指数

2 0


更新: 2021年11月3日 (Nanako Takahashi)
データ 詳細
【エントリー作品】
2

評価指数

0 0


更新: 2021年11月3日 (Nanako Takahashi)
Webページ 詳細
【利用しているデータ】 NHKクリエイティブ・ライブラリーの「音声百人一首」を利用しました
NHKクリエイティブ・ライブラリー https://www.nhk.or.jp/archives/creative/
NHKクリエイティブ・ライブラリーは、NHKアーカイブスの番組や番組素材から切り出した映像や音声を、視聴者のみなさんの表現・創作活動に利用していただくための「創作用素材」として、インターネットを通じて提供する無料のサービスです。
更新: 2021年11月3日 (Nanako Takahashi)
Webページ 詳細
【利用しているオープンデータ】 パブリックドメインの作品を朗読し、インターネットで無料で提供するLibriVoxの音声データを利用しました
更新: 2021年11月3日 (Nanako Takahashi)
Webページ 詳細
【関連するウェブサイト】 小倉百人一首LODの詳細を記述したウェブサイトです
小倉百人一首LOD http://karutalod.web.fc2.com/ogura.html
小倉百人一首のLOD(Linked Open Data)のためのウェブサイトです。 小倉百人一首LOD 小倉百人一首のLOD化を進めています。
更新: 2021年11月3日 (Nanako Takahashi)
Webページ 詳細
【関連するウェブサイト】 かるたの語彙の名前空間をGitHubに置いています
GitHub - tnanako/karutalod https://github.com/tnanako/karutalod
Contribute to tnanako/karutalod development by creating an account on GitHub.
更新: 2021年11月21日 (Nanako Takahashi)
論文 詳細
小倉百人一首LODのデータモデル設計と構築
高橋菜奈子
情報の科学と技術, 71, 8. (2021)
更新: 2021年11月3日 (Nanako Takahashi)
アイデア 詳細
【引用】このページは次のページを参考にして作成されました

小倉百人一首LOD

作成:2017年12月20日, 更新:2018年1月14日
8

評価指数



更新: 2021年11月3日 (Nanako Takahashi)

おすすめの助成制度

このページにおける記載内容を実施する際におすすめの助成制度の情報です。

コメント