タグ

PHPとUTF-8に関するtknzkのブックマーク (2)

  • UTF-8の冗長なエンコードとは何で、なんでそれがセキュリティ的に危ないのか?を文字コード知識レヴェル3くらいの凡プログラマが考えてみる - tohokuaikiのチラシの裏

    何故かあたり前にならない文字エンコーディングバリデーション | yohgaki's blog ってあるように、いまいち文字コードの不正な判定による危険性ってのが分かってない。 SJISの問題は、(2/3)SQLインジェクションを根絶!セキュア開発の極意 - 第5回■注目される文字コードのセキュリティ問題:ITproの記事がわかりやすかった。 というか、やっぱりPHP使ってると誰でも一度は「なんじゃこの『¥』は?」って思うもんなんで。 なるほど、確かに↓の図のように「あるバイト」が2つの意味を持つっていう文字コード形態はやばいんだなと。 EUC-JPはそんなことはしないで、1つのバイトには1つの意味しか取らせない。 だけど、これでも文字化けが起こることがある。経験的には、「マルチバイトをXX文字で切り落としたい」とかやった場合。ちゃんと文字コードを判定してくれるPHPでいえばmb_subst

    UTF-8の冗長なエンコードとは何で、なんでそれがセキュリティ的に危ないのか?を文字コード知識レヴェル3くらいの凡プログラマが考えてみる - tohokuaikiのチラシの裏
  • smarty ��� UTF-8���茵◐ず

    �����������ŝ�������鴻�������������с�������������祉�祉�� 腱���壔�������������障�������� ��阪����������������若�吾�勰�㏍�˨��篁ヤ�������水�ャ�� //��������潟����㋘�若�����茯㏍�粋昭��������勉����c�˨�粋┃絎� ������$smarty->register_prefilter("pre01");��� //�����������冴�������勉����c�˨�粋┃絎� ������$smarty->register_postfilter("post01");��� ������PHP�����˨��篁ヤ�������水�ャ����<�ŝ�帥�˨�������潟����㋘�若��������UTF-8��т�������������翫��

  • 1