はてなブックマークAtomAPIで入力が短いと文字化けする

活動メモ 2nd season はてなブックマークへのインポート
http://d.hatena.ne.jp/tsupo/20050629/1120030619

タグとして [定番] という文字列を使おうとすると、Atom API 経由での登録時、タグが文字化けしてしまうようです。他の文字列は化けません。なぜか、[定番]だけが化ける。謎です。→ idea:3416 にて報告。

僕も先日大量のブックマークをMM/Memoからインポートしたところ、いくつものデータが化けてしまいました。
特徴から考えるに、「短い物」が化けているのではないか? 文字化けしている多くの物は「タグだけで本文なし」というものだったからです。
たとえば「ネタ」というタグを打った場合、「ネタ」だけの物はかなり化けてこんな感じ化けていない物はこんなかんじに本文がついています。
id:tsupo さんが報告されている「定番」というタグも、それなりの本文をつけると文字化けしないようです。
また、本文があっても短い物がいくつか化けていました。たとえば
http://1470.net/mm/mylist.html/43?date=2005-01-28#m2728

[道具] [PHP] 『eAccelerator .::. Binaries Downloads』
http://www.arnot.info/eaccelerator/
Windows版のバイナリ

というメモがこんなかんじで本文も化けています。


しかし不可解なことに、「ネタ」も上記の「矚??」に化けるだけではなくて「??????」にも化けたりするようです(IEでは?の代わりに□が表示されます)。これは入力の際に無視されるタイトルが影響しているのでしょうか? でも、だったら「文字コードを判別するだけの十分な長さ」があるような気もするし… ←いまいくつか試したところ、タイトルの文字列によって文字化けの形が違うようです。

API文字コードなど「決めうち」あるいは「XML中の何かで指定」でいいような気がしますが、内部で文字コード自動判別してるんでしょうか。
とりあえず直してください。

あと、APIで「コレクションに加える」も指定できるようにしてください。