添付ファイル '1222�m�_�V�X�e��_�m�[�g�i��10��j.html'

ダウンロード

12/22知能システム論ノート（第10回）

Nグラムモデル
- 直前のn-1単語にのみ依存

最尤推定法
- 学習データの出現回数を全体の数で割る

最優推定法は、学習データの生起確率（尤度）を最大にするパラメータを求める

最優推定法の問題点
- 言語モデルの推定には不適切
  - 学習データになかったデータの確率が０になったり、たまたまでてきたマイナー単語の確率が高くなることがある。
- 何らかの方法で、見たことがない単語列の確率を推定する必要がある。

スムージング（ディスカウンティング）
- 確率０の事象に確率値をちょっとずつ分け与える
  - たまたま出てきた事象は確率値が高めに推定されているはず
  - 未観測の事象は確率０ではないはず
- 確率を足したら１になるように振り分ける
- どういうふうに割り振るか？
Laplace法
- すべての事象は1回は観測されたとする
  - すべての事象の観測回数を１増やす
  - 数式は手書き①
- Add-oneスムージングとも呼ばれる
複数のモデルの組み合わせ
- おなじみ観測の現象でも、確率値は違うのではないか？
- Nグラムは未観測でも、N-1グラムが観測されている場合、
- - N-1グラムの確率値が高ければ、Nグラムの確率も高い
  - N-1グラムの確率値が低ければ、Nグラムの確率も低い
- 手書き②
線形補間
- 複数のモデルの線形結合
- 例：Trigramモデルとbigram, unigramモデルと組み合わせる
- 手書き③
- 統計学では混合モデルと呼ばれる。
- EM学習
その他いろいろ
- Good-Turing
- Absolute discounting
- Linear discounting
- バックオフ
- Kneser-Ney法
- などが提案されている
- 実世界データから確率を学習するときは、スムージングなしではまともに動かない。

機械学習
- 実際のデータから規則性を自動的に学習したい
- 学習した結果を新しいデータに適用する
  - 過去から未来を予測する
  - パターン認識ともいう
- さまざまな分野で活用されている
  - 画像・音声認識
  - 言語処理・検索
  - 株価の予測
  - 事故の自動検出
  - ・・・
分類問題
- 何らかの入力に対してラベルを付ける問題
  - 予測問題ともいう
- 二値分類：ラベル＝o or x
  - スパムフィルター
  - 顔認識
- 多値分類：ラベル＝有限集合
  - テキスト分類：ラベル＝｛政治・経済・スポーツ・etc..｝
機械学習の枠組み
- 手書き④
例：スパムフィルター
- 電子メールをスパムかそうでないかに分類（二値分類）
- まず、各メールにどういう単語が出てきているかに注目＝特徴ベクトルを決める
特徴ベクトル
- 事象ｘのさまざまな特徴を特徴ベクトル（素性ベクトル）f(x)で表す
  - 特徴を持っていたら１、さもなくば０
- これにより、現実世界のさまざまなものを数学の世界に持って行ける
線形分類器
- 特徴ベクトルfの関数としてスパムらしさを定義
  - ⑤
- 線形分類器：特徴ベクトルの線形関数を考える
  - 手書き⑥
  - 学習が簡単
  - 多くの応用でよい結果
- σ（ｘ）＞０－＞スパム

添付ファイル

添付ファイルを参照するには、(下のファイル一覧にあるように)attachment:filenameと記述します。 [get]リンクのURLは変更される可能性が高いので、利用しないでください。

[ダウンロード | 表示] (2012-02-08 22:25:28, 106.7 KB) [[attachment:110 ��ꃂ�f��_�m�[�g.html]]
[ダウンロード | 表示] (2012-02-08 22:25:28, 31.0 KB) [[attachment:110�A��n�A��S��Y��m�[�g.html]]
[ダウンロード | 表示] (2012-02-08 22:25:28, 4.9 KB) [[attachment:112 �m�_�V�X�e��_��12��m�[�g.html]]
[ダウンロード | 表示] (2012-02-08 22:25:28, 11.0 KB) [[attachment:116 �A��n�A��S��Y�� 10��m�[�g.html]]
[ダウンロード | 表示] (2012-02-08 22:25:28, 1.9 KB) [[attachment:117 ��ꃂ�f��_�m�[�g.html]]
[ダウンロード | 表示] (2012-02-08 22:25:28, 20.0 KB) [[attachment:119 �m�_�V�X�e��_��13��m�[�g.html]]
[ダウンロード | 表示] (2012-02-08 22:25:28, 16.2 KB) [[attachment:1215�m�_�V�X�e��_�m�[�g�i��9��j.html]]
[ダウンロード | 表示] (2012-02-08 22:25:28, 6.5 KB) [[attachment:1222�m�_�V�X�e��_�m�[�g�i��10��j.html]]
[ダウンロード | 表示] (2012-02-08 22:25:28, 39.4 KB) [[attachment:15�m�_�V�X�e��_�m�[�g�i��11��j.html]]
[ダウンロード | 表示] (2012-02-08 22:25:28, 25.8 KB) [[attachment:2009�N�m�_�V�X�e��_�񓚃��.html]]
[ダウンロード | 表示] (2012-02-08 22:25:28, 1.3 KB) [[attachment:6�w��_index.html]]
[ダウンロード | 表示] (2012-01-19 14:08:59, 30.1 KB) [[attachment:furaga.zip]]
[ダウンロード | 表示] (2012-01-23 16:40:11, 41.3 KB) [[attachment:tino.pdf]]
[ダウンロード | 表示] (2012-01-23 16:40:23, 534.6 KB) [[attachment:tino2.pdf]]
[ダウンロード | 表示] (2012-01-31 15:42:56, 84.1 KB) [[attachment:tino_test.pdf]]

ファイルを添付する権限がありません。

知能システム論の添付ファイル:1222�m�_�V�X�e���_�m�[�g�i��10��j.html

添付ファイル '1222�m�_�V�X�e���_�m�[�g�i��10��j.html'

12/22知能システム論ノート（第10回）

添付ファイル

知能システム論の添付ファイル:1222�m�_�V�X�e��_�m�[�g�i��10��j.html

添付ファイル '1222�m�_�V�X�e��_�m�[�g�i��10��j.html'