あの、お待たせいたしました。 ご紹介にあずかりました tenpuraこと、倉石です。 よろしくお願いします。 ちょっと、変則的な プレゼンテーションで 文字が全部英語で、しゃべりが日本語、 という形でやりたいと思います。 このプレゼンテーションはですね、 はるばるアメリカから来て下さいました Mattと、あと会場のみなさまのため、 やりたいと思います。 とりあえず、日本語環境で、まず WordPressを使うときに必要になるんではないか というもの3つ、まとめてみました。 まず1番目 「WP Multibyte Patch」 もうデフォルトで、日本語版のパッケージの中には 入ってるんですけれども 使って下さっている方は、 手をあげて下さいますか。 なんで全員じゃないんでしょうね。 (会場、笑い) あ、WordPress、 使ってらっしゃらない方なんでしょうか たまに、何をしてるプラグインなのか わからない、というお話もききますので そういったことも説明したいと思います。 (.........) (マット見てるのかな....) (見てます?) ちょっと実は、マットともう 事前にこのことを話したことがありまして まあ、すごく言葉の言い方が難しいですよね。 で、ちょっと表現を考えてですね 「Not perfectly ready」という感じで表現しました。 素のままのですね、WordPress、 まあ英語版ですよね。 そのまんま使うとですね、いくつか 日本語で都合がわるいようなことになる。 みなさん、知ってらっしゃると 思うんですけれども それでですね、私が所属しております WordPressの日本語の、パッケージチームで これをもう、パッケージの中に 入れてしまおうということで、 1年以上前かな、けっこう長い間 パッケージの中に入れていただいてます。 じゃあ、具体的にどんなことが問題なのか、 このプラグインどんなことをやっているのか ということですけれども、 例として、上は、WP Multibyte Patchを 入れているときに EUC-JPのPingが来たものです。 下は、入れてない場合。 こんなふうに、破壊されてしまってですね、 元に戻せないような状態になってしまいます。 ちょっとですね、このへんは 最近はまあほとんど、UTF-8だと思いますので それほど、こういった文字化けに 悩まされたことが無いとは思うんですけれども UTF-8以外のかなりの多くの 世界中にですね、どんなマルチバイトのトラックバックが 現在存在するかわからないんですけれども、 そういうものは多分ほとんど、 こういう形で破壊されます。 なんで、ここの部分の機能に限っては、 日本語圏の方だけではなくて、英語圏の方でも 入れる価値はある ということなんですね。 なんでかというと、英語圏の方でも 自分たちが受けてるトラックバックが こういうふうに化けてるかもしれない。 までも、本当の元の字がどういう字か わからないから、 化けてるかどうかも わからないのかもしれませんけれども、 そういうことがあります。 次はですね、ピンバック。 これも同じく、EUC-JPの ピンバックを受けた場合。 上のほうが、WP Multibyte Patchが 入っている状態、で 下のほうは、もう データが入ってません。 これはですね、データベースのほうの 文字コードの設定とですね、 不整合が起きて、うまくデータ自体が 入っていないということですね。 さきほどのトラックバックのほうは、 実際にマルチバイト用の検出、エンコーティングの検出とか変換といったような機能が入ってるんですけれども、 ちょっと設定が問題がありまして、 先ほどのようになってます。 それで、こちらのほうはですね、 もともと、そういったようなUTF-8以外のですね ピンバックに対しての対処がもともとされていません。 どういうことやってるかというと、 ピンバックなので、 相手のピンバック打って来たページに ソースを取りにいってですね、 そのときにMetaタグのところにある Charsetのエンコーディングの部分をとって それを元にして、変換するというような形で 実装されています。 次ですね、「Excerpt」、 概要というか抜粋ですね。 RSSの配信などで、 文を全部出さないで途中で短くする といった機能なんですけれども、 そもそも日本語は、スペースで 単語が区切られていませんので スペース区切りで、単語数で抜粋をつくる、 もとの、WordPressの機能がうまく働きません。 それでですね、ちょっと凝ったことを 実は、してまして 気がついてる方はいないかもしれないですけども、 実は90%の文字がASCIIだったらば、 元のWordPressと同じように 単語数で抜粋をつくるようになってます。 それ以下であった場合は、 ASCIIの比率がそれ以下であった場合だと、 日本語の投稿だろう、というふうにみなしてですね、 文字数で、切り詰めます。 そのまんま何もない状態は、これで見た通り、 本当に長かったらもうだあーっと すごく長いことになってしまいます。 他に、このプラグインが どんなことをするかということなんですけれども、 Eメールをですね、JISで、いま日本で一般的に使われている JISのエンコーディングで、送ります。 素のままのWordPressは、 UTF-8で、本文がそのまんまです。 これは8bitなんですけれども、 JISで送った場合は7bitで送られるわけなんです。 けっこうケータイでメールを受ける方に、 重宝がられてるようなかんじの、 評判をいただいて「た」んですけれども、 昨年くらいから、かなりのケータイのキャリアで UTF-8のメールが読めるようになったみたいなんで ちょっとそのあたり、これをわざわざ 設定する必要がない場合もあるかもしれません。 これも、詳しすぎる説明かもしれないですけれども UTF-8でも、実は送るようになってまして デフォルトでは、自動的にJISかUTF-8の 判別を行って、送るようになってます。 判別というのがわかりにくいと 思うんですけれども、 要するに、投稿自体はUTF-8なんですね WordPressは。だから、 それをJISに変換して送るわけなんですけれども、 特殊な文字の場合は、 JISで表現できない場合があります。 なので、そういったように内部で一度、 エンコードしたものを、もう一回デコードしてみて、 元に戻らなかったらば なんか変な字があるなあということで UTF-8のメールを送るようにしています。 でもその場合も、8bitではなくてですね、 本文の部分はBase64で エンコーディングして送るというような 仕組みになってます。 でですね、メールの部分はかなり、 受ける環境によると思うんですね。 この部分が逆に要らないよ、という方は 先ほどの、前に戻んないといけないんで 紹介しませんけども説明のページがあります。 プラグインのサイトに。 そこ見ていただくとですね、 部分的にですね、機能をオンオフできますので このメールの部分だけ要らないで、 元のままでいいよという場合は オフにしていただければ いいんです。 こういったここで全部説明した機能が 全部個別にオンオフできるので 使ってる環境によって、 要らないよ、合わないよという場合は 単体でオンオフして下さい。 あとですね、どんなことするか。 日本語はですね、 全角スペースというものがあります。 検索するときにですね、これもやはり 単語の区切りとして扱うのが、 日本語の環境では自然かと思いますので、 そういったような挙動になるように しています。 あと、わりと最近なんですけども 投稿のエディタのところにですね、 下のほうに、Word Countというのが出て、 リアルタイムで打ち込んだ単語数が 出るようなかたちになっていますけども、 先ほどの例と同じでですね、 日本語は、スペースで区切らないので それがうまく動きません。 なので、そこに単語数の代わりに 文字数を表示する、というようにしています。 最初タイトルが3つ必要なもの、 というタイトルだったので やっと2番目に入りました。 ほとんど自分のプラグインの説明 なんですけども実は。 2番目 日本語化されたテーマ、ですね。 どういうことかというと、自分でけっこう いじれる方だったらいいんですけども、 普通にいろんなかっこいいテーマが WordPressはあってですね、 いれてみたけども、なんだこれ 表示が英語だとか、 なんか、日付の表示がおかしいよと、 そういうのに出会ったことがある方、 多いと思うんですね。 そういった意味で、スッと使って、 日本語が通る、というようなテーマ けっこう実は少ない。 これが、これからどんどん増えて いくべきだと思うんですね。 3番目です。 Ktai Pluginsと書いてあるんですけれども、 これは書いてあるとおりですね。 この私のプレゼンテーションの後に 行われます、池田百合子さんの ケータイのプレゼンテーションを 見ていただければ、 よくわかると思います。 ありがとうございました。