ウェブアーカイブ

大規模言語モデル「GPT-4o」を用いたウェブアーカイブのメタデータ作成:シンガポール国立図書館庁(NLB)の事例(文献紹介)

2024年11月8日付けでプレプリントサーバーarXivに、大規模言語モデル(LLM)のGPT-4oを用いたウェブアーカイブのメタデータ作成に関する記事“Web Archives Metadata Generation with GPT-4o: Challenges and Insights”が掲載されています。著者はシンガポール国立図書館庁(NLB)のAbigail Yongping Huang氏らです。

記事では、NLBが提供するウェブアーカイブ“Web Archive Singapore”を対象として、ウェブサイトのタイトルや抄録等のメタデータをGPT-4oを用いて自動生成する実験を行った結果がまとめられています。

GPT-4oを用いることで、コスト削減や効率化が実現できる一方、人が作成したメタデータの方が品質や精度が優れていること、大規模言語モデルは人間のカタロガーを代替するものではなく補完するものとして捉えるべきであること等が指摘されています。

続きを読む