AIが「言葉を紡ぐ」仕組み——テンソルとCUDAをエンジニア抜きで理解する

本記事はNVIDIAシリーズ第2回です。第1回「なぜ今AIなのか」はこちら。

言葉を「数字」に変換するところから始まる

AIにとって、文字はそのまま扱えない。まず全ての言葉を数字の列に変換する必要がある。

「東京」→ [0.82, 0.14, 0.67, ...]（数百個の数字の組み合わせ）「大阪」→ [0.79, 0.11, 0.71, ...]

なぜこんなことをするのか。数字にすれば距離が測れるからだ。「東京」と「大阪」の数字の列は似ている（どちらも日本の都市）。「東京」と「リンゴ」は全く違う数字の列になる。

この「言葉を数字の空間に配置する」作業を**埋め込み（Embedding）**と呼ぶ。地図上に都市をプロットするようなイメージだ。近い概念は近い場所に置かれる。

「文脈を読む」仕組み——Attention

ここからが核心だ。

「彼は銀行に行った」という文の「銀行」と、「川岸の土手（bank）」という文の「bank」は同じ単語でも意味が違う。前後の文脈によって意味が変わる——これをAIはどう処理するのか。

答えが**Attention（注意機構）**だ。

ある単語を処理するとき、文章内の全ての単語との「関係性の強さ」を同時に計算する。「銀行」という単語なら「行った」「預金」「ATM」との関係は強く、「川」「釣り」との関係は弱い——この重み付けを数値化する。

ここで再びNFLの出番だ。QBがプレイ前に相手ディフェンスを読む瞬間を想像してほしい。全選手を同時に視野に入れ、誰が空いているか、どのルートが有効かを瞬時に評価する。Attentionも同じだ。文章内の全単語を同時に「スキャン」し、今処理している単語にとって何が重要かを計算する。

そしてこの計算を——文章内の全単語の全組み合わせ分、同時に行う。

テンソルとは「計算の塊」の名前

ここまでの話を整理すると：

単語 → 数字の列（数百次元）
文章 → 数字の列が並んだ表（行列）
Attention → その表同士の掛け算を全組み合わせで実施

この「多次元の数字の塊」のことをテンソルと呼ぶ。難しい名前がついているが、要は「何百万もの数字が整然と並んだスプレッドシート」だ。

GPT-4クラスのモデルが一文を生成するとき、このスプレッドシートの掛け算が数十億回走る。

ここにIフォーメーション（CPU）の限界がある。一行ずつ丁寧に計算していたら、日が暮れる。ショットガンフォーメーション（GPU）なら、何千列も同時に処理できる。テンソルの構造とGPUの並列処理は、まるで鍵と鍵穴のように噛み合っている。

CUDAが「乗り換え不可能」な理由

GPUが並列処理に向いているのは分かった。ではAMDのGPUではダメなのか。

性能だけで言えば、AMDのGPUもNVIDIAに肉薄しつつある。しかし世界中のAI研究所がNVIDIAを使い続けるのには、CUDAという圧倒的な理由がある。

CUDAとは、NVIDIAが2006年に公開したGPUプログラミングの基盤ソフトウェアだ。以来20年、世界中の研究者がCUDAで書いたコードを積み上げてきた。

PyTorch（AI研究の標準フレームワーク）→ CUDA最適化
TensorFlow（Googleが作ったAI開発ツール）→ CUDA最適化
世界中の大学・研究所のAIコード → CUDA前提

AMDに乗り換えるということは、この20年分の資産を全て捨てることを意味する。プレイブックなしでNFLの試合に出るようなものだ。パフォーマンスの差以前に、そもそもゲームにならない。

NVIDIAの堀は過去形で積み上がっている。毎年深くなっていく。

チップを作らなくても80%の利益率

NVIDIAの財務構造は異質だ。

実際のGPU製造はTSMC（台湾）に外注している。にもかかわらず営業利益率は約80%——これはAppleのiPhoneビジネス（約30%）すら大きく上回る。

なぜか。CUDAというソフトウェア資産に対してコスト追加なしで課金し続けているからだ。GPUを買ったエンジニアは自動的にCUDAエコシステムに縛られる。ハードウェアは消耗品だが、ソフトウェアの堀は年々深くなる。

これはフランチャイズモデルに近い。NVIDIAはプレイブック（CUDA）を持つ本部で、TSMCはそのプレイブックを実行する現場だ。利益はほぼ本部が取る。

投資家が次に見るべき数字

指標	意味
データセンター売上比率	AIチップ需要の直接指標（現在80%超）
CUDA対応フレームワーク数	堀の深さの代理指標
TSMC先端ノード稼働率	NVIDIAチップの製造能力の代理指標
東京エレクトロン受注残	半導体製造装置需要の先行指標

第1回で触れた日本のサプライチェーン企業（東エレク・アドバンテスト・信越化学）の業績を読むとき、このデータセンター需要の強さが背景にあることを念頭に置くと、決算の読み方が変わってくる。

第3回「チップの微細化と日本素材の堀」はこちら。

出典: 各社IR資料・公開情報をもとに編集部作成 | English version

免責事項 | 本記事は情報提供を目的としており、投資推奨・売買指示ではありません。 URL: ja/earnings/2026/03/nvidia-ai-series-02-ja/Save_As: ja/earnings/2026/03/nvidia-ai-series-02-ja/index.html

AIが「言葉を紡ぐ」仕組み——テンソルとCUDAをエンジニア抜きで理解する

言葉を「数字」に変換するところから始まる

「文脈を読む」仕組み——Attention

テンソルとは「計算の塊」の名前

CUDAが「乗り換え不可能」な理由

チップを作らなくても80%の利益率

投資家が次に見るべき数字

AIが「言葉を紡ぐ」仕組み——テンソルとCUDAをエンジニア抜きで理解する

なぜ今、AIなのか——稟議書とショットガンフォーメーションで読むNVIDIA一強の理由

なぜ今、AIなのか——稟議書とショットガンフォーメーションで読むNVIDIA一強の理由

トーメンデバイス、AIメモリ特需に乗る — サムスン専売商社、今が旬