ここのPrismo使っててエラー表示されたら報告するスレッドです。 もちろん他の方法で報告しても良いですが、情報集約としてスレッドがあっても良いかなと。
それは会話の一部にすぎません。
全てのコメントを見る
よくわからない文字化け
https://prismo.fedibird.com/posts/82e578ac-85e7-4d31-b95b-fe72981c06f6
同じくITmediaの記事をリンク投稿しようとして、タイトル自動取得でバグる→タイトル手入力して投稿→プレビューテキスト(※)表示がバグる、となりました。
もしかしてとITmediaの記事の文字コードを確認したら「ShiftJIS」ですね。 おそらくShiftJISのページに対するタイトル取得とかプレビューテキスト取得がバグっているのでは。
※仮称。正式名称なんでしょうねこれ。
そもそもテキスト取得時の文字コードをUTF8決め打ちにしてるようなので、ShiftJISに限らず、UTF8でない文字コードのWebページだと漏れなく文字化けしそうです。 EUC-JPとか確かPHPブログエンジンでよく使われてたような?
@centumix アルファベット文化圏の人にありがちな思考ですね決め打ちしちゃう(苦笑)
いや別にアルファベット文化圏の人を馬鹿にしているわけでない
ShiftJISを使ってきたボクたちだってアラビア文字のRTL禁則処理を知ってるか?と言われたら多くの人は知らないわけですし
それらの人のためにやはりプログラマブルにUTF-8変換する仕組みがPrismoには必要ですよ
※アラビア文字のRTL禁則処理 アラビア文字は右から左へ記されるが、アラビア数字に関しては左から右へ記されるという禁則処理
つまり16という数値は「こけくきか16おえういあ」ということ
ちなみにこれらを「BiDi」もしくは「双方向テキスト」という
@centumix ITMedia Newsの編集部デスクと面識があるので伝えておきますね
ていうか@mazzo@mstdn.guru がその人ですw Mastodonユーザなんですよ松尾デスクw
Fedeloperの方に詳細を記しましたが、本件は修正しました。
UTF-8ではないサイトで、タイトルと本文抜粋が文字化けする問題を修正
ITmediaとこだわりアカデミーで発生していましたが、他のケースでも解決しているのではないかと思います。
修正ありがとうございます。 既に投稿済のストーリーの本文抜粋の文字化けも直ってますが、アレって動的に取得してたんですか?
いえ、最初に取得したあとは基本的に更新されません。 moreの中にreScrapという項目があるのですが、アレが再取得の操作です。ただし、元が変更されていない場合は再取得されないと思います。今回は、おかしかった記事は手動で更新しています。
あ、やはり手動更新されてましたか。 で、reScrapが再取得、と。
よくわからない文字化け
https://prismo.fedibird.com/posts/82e578ac-85e7-4d31-b95b-fe72981c06f6
同じくITmediaの記事をリンク投稿しようとして、タイトル自動取得でバグる→タイトル手入力して投稿→プレビューテキスト(※)表示がバグる、となりました。
もしかしてとITmediaの記事の文字コードを確認したら「ShiftJIS」ですね。
おそらくShiftJISのページに対するタイトル取得とかプレビューテキスト取得がバグっているのでは。
※仮称。正式名称なんでしょうねこれ。
そもそもテキスト取得時の文字コードをUTF8決め打ちにしてるようなので、ShiftJISに限らず、UTF8でない文字コードのWebページだと漏れなく文字化けしそうです。
EUC-JPとか確かPHPブログエンジンでよく使われてたような?
@centumix アルファベット文化圏の人にありがちな思考ですね決め打ちしちゃう(苦笑)
いや別にアルファベット文化圏の人を馬鹿にしているわけでない
ShiftJISを使ってきたボクたちだってアラビア文字のRTL禁則処理を知ってるか?と言われたら多くの人は知らないわけですし
それらの人のためにやはりプログラマブルにUTF-8変換する仕組みがPrismoには必要ですよ
※アラビア文字のRTL禁則処理
アラビア文字は右から左へ記されるが、アラビア数字に関しては左から右へ記されるという禁則処理
つまり16という数値は「こけくきか16おえういあ」ということ
ちなみにこれらを「BiDi」もしくは「双方向テキスト」という
@centumix ITMedia Newsの編集部デスクと面識があるので伝えておきますね
ていうか@mazzo@mstdn.guru がその人ですw
Mastodonユーザなんですよ松尾デスクw
Fedeloperの方に詳細を記しましたが、本件は修正しました。
UTF-8ではないサイトで、タイトルと本文抜粋が文字化けする問題を修正
ITmediaとこだわりアカデミーで発生していましたが、他のケースでも解決しているのではないかと思います。
修正ありがとうございます。
既に投稿済のストーリーの本文抜粋の文字化けも直ってますが、アレって動的に取得してたんですか?
いえ、最初に取得したあとは基本的に更新されません。 moreの中にreScrapという項目があるのですが、アレが再取得の操作です。ただし、元が変更されていない場合は再取得されないと思います。今回は、おかしかった記事は手動で更新しています。
あ、やはり手動更新されてましたか。
で、reScrapが再取得、と。