トークンとは？LLMが文章を「数値化して理解する」仕組みを超やさしく解説

生成AI

LLM

最終更新2025年10月21日

リンドくん

たなべ先生、ChatGPTとか使ってると「トークン」って言葉をよく見るんですけど、これって何なんですか？

たなべ

トークンは、AIが文章を理解するための最小単位のようなものなんだ。
人間が文章を「単語」に分けて理解するように、AIは「トークン」に分けて処理するんだよ。

最近、ChatGPTをはじめとするAI（LLM: 大規模言語モデル）を使う機会が増えてきたのではないでしょうか。
そんな中で「トークン制限」「トークン数」といった言葉を目にすることも多いと思います。

しかし、「トークンって結局何なの？」と疑問に思っている方も少なくないはずです。

この記事では、AI技術の基礎となる「トークン」について、プログラミング初心者の方でも理解できるよう、できるだけ平易な言葉で解説していきます。
トークンの仕組みを知ることで、AIがどのように文章を理解しているのか、その神秘的なプロセスが見えてくるはずです。

プログラミング学習でお悩みの方へ

HackATAは、エンジニアを目指す方のためのプログラミング学習コーチングサービスです。経験豊富な現役エンジニアがあなたの学習をサポートします。

✓ 質問し放題

✓ β版公開中（2025年内の特別割引）

HackATAの詳細を見る

トークンとは何か？基本概念を理解しよう

リンドくん

そもそもなぜAIは普通に文章を読めないんですか？人間みたいに読めばいいのに...

たなべ

それはね、コンピュータは数値しか扱えないからなんだ。
文字や言葉を直接理解することはできないから、まずは数値に変換する必要があるんだよ。

トークンの定義

トークン（Token）とは、AIが文章を処理する際の最小単位のことです。

人間が文章を読むとき、自然と「単語」や「文節」に区切って理解していますよね。
例えば「今日は良い天気です」という文章を見たとき、「今日」「は」「良い」「天気」「です」というように、無意識に分解して理解しています。

AIも同じように、文章を小さな単位に分解して処理します。この小さな単位が「トークン」なのです。

なぜトークン化が必要なのか

コンピュータは本質的に数値しか理解できません。
文字や言葉を直接扱うことはできないのです。

そこで、以下のようなプロセスが必要になります。

文章をトークンに分割する（トークン化）
各トークンを数値に変換する（数値化）
数値データとして処理する（AI処理）
結果を再び文章に戻す（デコード）

このように、トークンはAIが文章を理解するための橋渡し役となる重要な存在なのです。

トークンの種類

トークンには主に以下のような種類があります。

単語トークン → 「プログラミング」「学習」など、完全な単語
サブワードトークン → 「プログラ」「ミング」など、単語の一部
文字トークン → 「あ」「A」など、個々の文字
特殊トークン → 文章の始まりや終わりを示す特別なマーカー

ChatGPTなどの最新のLLMでは、主にサブワードトークンという方式を採用しています。
これは、単語を適度な大きさに分割する方法で、効率性と柔軟性のバランスが取れているためです。

例えば「unbreakable（壊れない）」という英単語は、「un」「break」「able」のように分割されることがあります。
日本語の場合も、「プログラミング」が「プログラ」「ミング」のように分割されることがあります。

トークン化の仕組み - 文章が数値に変わるまで

リンドくん

でも、どうやって文章をトークンに分けるんですか？何か決まりがあるんですか？

たなべ

すごくいい質問だね！実はトークナイザーという特別なプログラムが、文章を最適なトークンに分割してくれるんだ。そしてそのルールは学習によって作られているんだよ。

トークナイザーの役割

トークナイザー（Tokenizer）は、文章をトークンに分割する専門プログラムです。

トークナイザーには、事前に大量のテキストデータから学習した「分割ルール」が組み込まれています。
これにより、文章を効率的かつ意味のある単位に分割できるのです。

具体的なプロセスは以下の通りです。

ステップ① 文章の入力

入力: "今日はプログラミングを勉強します"

ステップ② トークンへの分割

トークン化: ["今日", "は", "プログラ", "ミング", "を", "勉強", "します"]

ステップ③ 数値IDへの変換

数値化: [1234, 45, 5678, 9012, 23, 3456, 7890]

このように、各トークンには固有の数値ID（トークンID）が割り当てられており、AIはこの数値を使って処理を行います。

なぜ完全な単語じゃないの？

ここで疑問に思うのが、「なぜ完全な単語に分割しないの？」ということではないでしょうか。

サブワード方式を採用する理由は以下の通りです。

未知の単語への対応 → 学習データになかった新しい単語でも、既知のパーツの組み合わせで表現できる
データの効率化 → 辞書のサイズを抑えられる（すべての単語を記憶する必要がない）
言語の柔軟性 → 造語や専門用語にも対応しやすい

例えば、「ChatGPT」という比較的新しい言葉でも、「Chat」「GP」「T」のように分割することで、既存の知識で処理できるようになります。

日本語と英語でのトークン化の違い

実は、日本語と英語ではトークン化の方法が少し異なります。

英語の場合

入力: "Hello, world!"
トークン: ["Hello", ",", " world", "!"]
トークン数: 4個

英語は単語がスペースで区切られているため、比較的トークン化しやすい言語です。

日本語の場合

入力: "こんにちは、世界！"
トークン: ["こんにちは", "、", "世界", "！"]
トークン数: 4個

日本語は単語の区切りが明確でないため、より複雑な処理が必要になります。
そのため、同じ意味の文章でも、日本語の方が英語よりもトークン数が多くなる傾向があります。

これは料金や処理速度にも影響するため、実用上知っておくと役立つ知識です。

LLMがトークンを使って文章を理解する仕組み

リンドくん

トークンに分けて数値化した後は、どうやって意味を理解するんですか？

たなべ

ここからが本当に面白いところなんだ！
AIは数値化されたトークンをベクトル（多次元の数値の配列）に変換して、トークン同士の関係性を学習するんだよ。

エンベディング（埋め込み）とは

トークンIDに変換された後、さらにエンベディング（Embedding）と呼ばれる処理が行われます。

エンベディングとは、各トークンを多次元のベクトル（数値の配列）に変換することです。
例えば、1つのトークンが768個や1024個の数値で表現されます。

トークン: "猫"
トークンID: 1234
エンベディング: [0.23, -0.45, 0.67, 0.12, ..., 0.89]
                 ↑ 768個や1024個の数値が並ぶ

このベクトル表現により、以下のようなことが可能になります。

意味の近い単語は近い位置に配置される
- 「猫」と「犬」は近くに
- 「猫」と「プログラミング」は遠くに
単語の関係性を数学的に表現できる
- 「王様 - 男 + 女 = 女王」のような関係性を計算で表現

アテンション機構 - 文脈を理解する鍵

ChatGPTなどの最新のLLMは、Transformerというアーキテクチャを使用しています。
その中核となるのがアテンション機構（Attention Mechanism）です。

アテンションは、文章中の各トークンが他のどのトークンに注目すべきかを学習します。

例えば、以下の文章を考えてみましょう。

"銀行の口座に預金した。その銀行は駅の近くにある。"

この場合、2番目の「銀行」は「駅の近く」という情報に強く注目します。
一方、1番目の「銀行」は「口座」「預金」に注目します。

このように、同じ単語でも文脈によって注目する対象が変わるのです。
これが、AIが文脈を理解できる理由なのです。

トークンから文章への変換（デコード）

AIが処理を終えると、今度は逆のプロセスが行われます。

AIが出力すべき次のトークンを予測する
トークンIDを実際の文字列に戻す
文章として出力する

ChatGPTが少しずつ文章を生成していく様子を見たことがあると思いますが、あれはまさに1トークンずつ予測して出力しているからなのです。

各トークンを予測する際、AIは「これまでの文脈を考えると、次に来る最も確率が高いトークンは何か？」を計算しています。
そして確率が最も高い（または上位の）トークンを選んで出力していくのです。

トークン数の制限と実用的な影響

リンドくん

ChatGPTで「トークン制限」ってよく見るんですけど、何が制限されてるんですか？

たなべ

そうだね、これは実際に使う上で重要なポイントなんだ。
LLMには一度に処理できるトークン数に上限があるんだよ。

コンテキストウィンドウとは

LLMにはコンテキストウィンドウ（Context Window）と呼ばれる、一度に処理できるトークン数の上限があります。

例えば以下のような形です。

GPT-5 → 約40万トークン
Claude 4.5 Sonnet → 約100万トークン

この制限には、入力（あなたが送った質問）と出力（AIの返答）の両方が含まれます。

トークン数が多いとどうなる？

トークン数が多いことの影響は以下の通りです。

料金への影響

多くのAI APIは、使用したトークン数に応じて課金されます。
つまり、長い文章を送れば送るほど、より多くの料金がかかるということです。

処理速度への影響

トークン数が多いほど、AIの処理に時間がかかります。
長い文章を送ると、返答が遅くなることがあるのはこのためです。

精度への影響

実は、トークン数が多すぎると、AIが情報を正確に把握しきれなくなることがあります。
人間も長すぎる文章は理解しにくいのと同じですね。

効率的なトークン使用のコツ

以下のような工夫で、トークン数を節約できます。

要点を簡潔にまとめる → 冗長な表現を避ける
必要な情報だけを送る → 関係ない情報は省く
プロンプトを工夫する → より短い指示で同じ結果を得る
会話履歴の管理 → 古い会話を適度に削除する

特にプログラミングのコード生成を依頼する場合など、不要なコメントや説明を省くことで、かなりのトークン数を節約できます。

トークンを意識したAIとの付き合い方

リンドくん

トークンの仕組みを知ると、AIの使い方も変わってきそうですね！

たなべ

その通り！トークンを理解することで、より効率的にAIを使いこなせるようになるんだ。
これからAI開発を学ぶ上でも、すごく大事な基礎知識だよ。

プロンプト設計におけるトークンの考慮

AIに質問や指示を送る際（プロンプト）、トークン数を意識することで、より良い結果が得られます。

効率的なプロンプトの例

❌ 悪い例（冗長）
「プログラミング言語のPythonについて、その歴史的な背景や、
どのような場面で使用されているのか、また初心者が学習する際の
メリットやデメリットについて、できるだけ詳しく教えてください」

✅ 良い例（簡潔）
「Pythonの特徴と初心者におすすめの理由を教えてください」

このように、簡潔にまとめることで、トークン数を節約しつつ必要な情報を得られます。

AI開発を学ぶ上でのトークンの重要性

これからAI開発を学びたいと考えている方にとって、トークンの理解は非常に重要です。

自然言語処理（NLP）の基礎

トークン化は、自然言語処理の最も基本的な処理の一つです。
この仕組みを理解することで、より高度なAI技術の学習がスムーズになります。

AI APIの効率的な利用

OpenAI APIやAnthropic APIなどを使用する際、トークン数の管理は必須スキルです。
適切にトークンを管理することで、コストを抑えながら効果的なアプリケーションを開発できます。

パフォーマンス最適化

AIアプリケーションを開発する際、トークン数を意識した設計により、以下のメリットが得られます。

レスポンス速度の向上 → 処理するトークン数が少ないほど速い
コスト削減 → トークン使用量を抑えることで料金を削減
エラーの回避 → トークン制限を超えないように設計

まとめ

リンドくん

トークンの仕組みがだいぶ理解できました！AIがどうやって文章を理解してるのか、イメージが湧いてきた気がします！

たなべ

素晴らしいね！トークンは一見複雑に見えるけど、基本的な考え方はシンプルなんだ。
これからAIを使う上でも、AI開発を学ぶ上でも、この知識はきっと役立つはずだよ。

今回の記事では、LLMにおける「トークン」の基本概念から実用的な知識まで、幅広く解説してきました。

重要なポイントをおさらいしましょう。

トークンはAIが文章を理解するための最小単位である
文章はトークンに分割され、数値化されてAIに処理される
エンベディングとアテンション機構により、AIは文脈を理解する
トークン数には制限があり、料金や速度に影響する
効率的なトークン使用でAIをより賢く活用できる

これからの時代、プログラミングスキルだけでなく、AIの基礎知識も重要になってきます。
トークンの仕組みを理解することは、その第一歩と言えるでしょう。

AIは決してブラックボックスではありません。
その裏側の仕組みを理解することで、より効果的に活用でき、そして自分でもAIアプリケーションを開発できるようになります。

AI技術は日々進化していますが、その基礎となる概念は変わりません。
トークンという基礎をしっかり理解して、これからのAI時代を一緒に楽しんでいきましょう！

この記事をシェア

トークンとは？LLMが文章を「数値化して理解する」仕組みを超やさしく解説

プログラミング学習でお悩みの方へ

トークンとは何か？基本概念を理解しよう

トークンの定義

なぜトークン化が必要なのか

トークンの種類

トークン化の仕組み - 文章が数値に変わるまで

トークナイザーの役割

なぜ完全な単語じゃないの？

日本語と英語でのトークン化の違い

LLMがトークンを使って文章を理解する仕組み

エンベディング（埋め込み）とは

アテンション機構 - 文脈を理解する鍵

トークンから文章への変換（デコード）

トークン数の制限と実用的な影響

コンテキストウィンドウとは

トークン数が多いとどうなる？

効率的なトークン使用のコツ

トークンを意識したAIとの付き合い方

プロンプト設計におけるトークンの考慮

AI開発を学ぶ上でのトークンの重要性

まとめ

関連するコンテンツ