Nグラム法

G検定

Nグラム法とは

Nグラム法とは自然言語(テキスト)を連続するN個の文字、もしくはN個の単語単位で単語を切り出す手法のことです。

N=1のときユニグラム(unigram), N=2のときバイグラム(bigram), N=3のときトライグラム(trigram)と呼ばれます。

ここから文字と単語それぞれのN-gramについて具体的な例をあげて紹介してみます。

任意の文字列や文書を連続したn個の文字で分割するテキスト分割方法.特に,nが1の場合をユニグラム(uni-gram),2の場合をバイグラム(bi-gram),3の場合をトライグラム(tri-gram)と呼ぶ.

第5回 N-gramのしくみ
前回は形態素解析を使う検索エンジンのしくみについて説明しました。今回は,FINDSPOTで使用しているN-gramという検索エンジンのしくみについて説明します。
N-gramの作り方 - Qiita
はじめに 自然言語処理100本ノックをやるに当たって、N-gramの壁にぶち当たる人もいるかと思うので、簡単にまとめます。 N-gramとは コトバンクでは以下の様になってました。 任意の文字列や文書を連続したn個の文...

【G検定】G検定の対策のまとめ

タイトルとURLをコピーしました