GlyphSignal

Tf–idf

コーパス内の文書においてある単語がどれだけ重要かを示す統計量

1分で読めます

なぜトレンドなのか

Interest in “Tf–idf” spiked on Wikipedia on 2026-02-28.

When a Wikipedia article trends this sharply, it usually reflects a noteworthy real-world event—whether breaking news, a cultural milestone, or a viral discussion driving collective curiosity.

GlyphSignal tracks these patterns daily, turning raw Wikipedia traffic data into a curated feed of what the world is curious about. Every spike tells a story.

2026-01-30ピーク: 202026-02-28
30日間合計: 289

要点まとめ

  • 情報検索の分野において、 tf–idf は、 term frequency–inverse document frequency の略であり、コーパスや収集された文書群において、ある単語がいかに重要なのかを反映させることを意図した統計量(数値)である。
  • ある単語のtf-idfの値は文書内におけるその単語の出現回数に比例して増加し、また、その単語を含むコーパス内の文書数によってその増加が相殺される。
  • 今日、tf-idfはもっとも有名な語の重みづけ(term-weighting)手法である。

情報検索の分野において、tf–idf は、term frequency–inverse document frequencyの略であり、コーパスや収集された文書群において、ある単語がいかに重要なのかを反映させることを意図した統計量(数値)である。また、tf-idfは情報検索や、テキストマイニング、ユーザーモデリングにおける重み係数にもよく用いられる。ある単語のtf-idfの値は文書内におけるその単語の出現回数に比例して増加し、また、その単語を含むコーパス内の文書数によってその増加が相殺される。この性質は、一般にいくつかの単語はより出現しやすいという事実をうまく調整することに役立っている。今日、tf-idfはもっとも有名な語の重みづけ(term-weighting)手法である。2015年に行われた研究では、電子図書館におけるテキストベースのレコメンダシステムのうち83%がtf-idfを利用していたことがわかった。

Wikipediaで全文を読む →

WikipediaコンテンツはCC BY-SA 4.0の下で提供

共有

続きを読む

2026-02-28
2
土居 志央梨 は、日本の女優。
149,781 ビュー
3
水上 恒司 は、日本の俳優。福岡県福岡市東区出身。2022年8月までの芸名は岡田 健史 。
73,727 ビュー
5
アーヤトッラー・セイイェド・アリー・ホセイニー・ハーメネイー は、イランの政治家、法学者。最高指導者(第2代)、大統領(第3代)。日本ではハメネイ師と表記されることが多い。
62,623 ビュー
6
山本 章一 は、日本の漫画家。北海道在住。別名義に一路 一。
57,251 ビュー
7
坂東 龍汰 は、日本の俳優。アメリカ合衆国・ニューヨーク州ニューヨーク市生まれ、北海道伊達市出身。鈍牛倶楽部所属。
49,414 ビュー
8
ジェフリー・エドワード・エプスタイン は、アメリカ合衆国の実業家、投資家。発音に準じてエプスティーンとも表記される。
44,016 ビュー
続きを読む: