# 増殖するWikipedia機械翻訳サイト

本日、告知していたイベント「翻訳フォーラム式辞書デー」が終了しました。

ご参加くださった皆さん、ありがとうございます。

今回初めての試みとして、事後のアーカイブ配信もあります。参加者にはすでに情報が届いていると思います。復習などにご活用ください。また、イベント中にメンバー4人が紹介した関連資料については、いつものようにこちらにまとめてあります。fhonyaku.blog.jp

各セッションで使った資料のうち、事後配布を予定しているプレゼンテーション資料は、近日中に参加者に共有されます。私の担当分も、

「翻訳者として辞書を使う―⼊⾨編―」
「たのしい国語辞典」

を配布します。

さて、イベントが終わって、こちらでもシソーラス/類語辞典のことをもう少し書きたいのですが、ちょっと時間がないので、別のことをネタにします。今日、最後の対談のとき私が言った「Wikipediaの機械翻訳サイトが多すぎる」という話です。

たとえば、Martin E. Hellmanという人名を検索すると、ほとんど英語サイトばかりのなか、

f:id:yasagure88:20220129230853p:plain

こんな日本語サイトがヒットします。おやっ、と思って見にいくと(最近はURLを見ただけで怪しいと気づけるようになったので、もちろん期待はしませんが)、リンク先はこんなページ。

f:id:yasagure88:20220129231314p:plain

(字が小さいですね。クリックすると拡大できます)

一見すると、それなりの文章のようにも見えますが、これは機械翻訳の出力です。「潜在的な失敗」も怪しいし、パラグラフの最後にある書名の処理でも明らかです。こんなものを、仕事の参考にするわけにはいきません。

この最近(ほんの1、2年くらい)で、こういう

Wikipedia 英語版を機械翻訳しただけのサイト

がけっこうな勢いで増殖しています。

ネット全体が機械翻訳に侵食されている話は先月も書きました。

baldhatter.hatenablog.com

今回は、それのWikipediaもどき版だということです。

幸い、Chrome 向けに「uBlacklist」という拡張機能が公開されていて、これを使えば、検索結果から除外したいサイトをどんどんブラックリスト*1に登録していけます。

chrome.google.com

そうやって除外登録した「Wikipedia機械翻訳サイト」が、いつの間にかこんなにたまりました。

f:id:yasagure88:20220129232346p:plain

すでにこれだけの数で、それでもしばらくすると、また新手がヒットします。

機械翻訳の是非についてはいろいろな見方がありますが、少なくとも日本語のネット検索環境にとっては、有害でしかありません。

*1:そういえば、このブラックリスト(blacklist)というのはPC的に問題があるとして書き換えが進んでいたりしますね