Question 1

同形文字とは何ですか?

Accepted Answer

ホモグリフは、ラテン語の「a」に似たキリル文字の「а」など、異なるスクリプトまたはエンコーディングの別の文字のように見える文字です。攻撃者はこれらをスプーフィングしたドメイン、ユーザー名、メッセージに使用します。このツールは、コード ポイントと置換によってこれらの文字を表示します。

Question 2

これは Unicode 正規化とどう違うのでしょうか?

Accepted Answer

Unicode 正規化 (NFKC など) は、互換性と幅のバリアントを標準的な方法で折り畳みます。このツールは、NFKC を明示的で紛らわしい小さなマップと組み合わせているため、各文字にフラグが付けられた理由がわかります。これは、単純な Unicode 正規化ツール パスを超えて役立ちます。

Question 3

厳密な ASCII モードは正規の非英語テキストを変更しますか?

Accepted Answer

厳密な ASCII フォールバックは、バンドルされた混同しやすいマップに表示される文字、または NFKC での変更を置き換えます。他の非 ASCII 文字は変更されません。正規のテキストにこれらのマップされた文字が含まれている場合は、変更される可能性があるため、分析リストを確認してください。

Question 4

私のテキストはサーバーに送信されますか?

Accepted Answer

いいえ。ページが読み込まれた後の検出と変換には JavaScript のみが使用されます。この混同可能なコンバータは、分析のためにペーストをアップロードしません。

Question 5

これであらゆるなりすましを捕まえることができるでしょうか?

Accepted Answer

いいえ。カバレッジは決定論的でマップベースであり、機械学習ではありません。これは一般的な類似文字トリックには役立ちますが、完全なセキュリティ監査ではありません。

Question 6

同形文字の生成モードは何をしますか?

Accepted Answer

入力内の ASCII 文字と数字を、クリーンアップに使用された同じバンドル マップからの決定的な類似文字に置き換えます。これは、承認された環境 (モデレーション QA など) でテスト文字列を構築する場合に役立ちます。なりすましや保護の回避を目的としたものではありません。

ホモグリフコンバーター — Unicodeの紛らわしい文字を検出

このホモグリフコンバータの機能