ホモグリフコンバーター — Unicodeの紛らわしい文字を検出
変換はベストエフォート型です。マッピングされた混同可能要素と NFKC フォールディングは決定的ですが、一部の正当な Unicode にはフラグが立てられません。
貼り付けまたは入力 - 入力すると結果が更新されます (長い入力の場合は軽くデバウンスされます)。
元のビュー内の疑わしい文字には下線が引かれ、「疑わしい」というラベルが付けられます。ハイライトカラーに加えて。
まだ分析する文字がありません。上にテキストを貼り付けると、同形文字と混同可能な文字の内訳が表示されます。
見た目が紛らわしいUnicode文字を検出し、より安全なASCIIや正規化Unicodeへ変換。ブラウザ内で無料利用。
このホモグリフコンバータの機能
ホモグリフ コンバーターは、通常のラテン文字や数字 (混同しやすいもの) のように見える Unicode 文字を検出し、それらがどのように正規化または置換されたかを示します。また、Generate homoglyphs を実行して、テスト用にプレーン ASCII から決定的なスプーフィングのような文字列を構築することもできます。この無料の混同可能コンバータおよび Unicode 混同可能チェッカーは、ブラウザ内で完全に実行されます。Unicode 正規化ツール、なりすましテキスト クリーナー、またはセキュリティとモデレーションのための類似文字コンバータとして使用できます。
この Unicode 正規化ツールの使用方法
- 検査するテキストを入力領域に貼り付けるか入力します。
- 貼り付けたテキストをクリーンアップするか、ASCII からテスト サンプルを構築するかに応じて、「読み取り可能な Unicode を保持」、「厳密な ASCII フォールバック」、または「同形文字の生成」を選択します。
- オリジナル (ハイライト付き) と出力を並べて比較します。分析表でコード ポイントとその理由を確認してください。
- 結果をコピーするには「出力テキストのコピー」を使用し、リセットするには「クリア」を使用します。
変換モード: 読み取り可能な Unicode、Unicode から ASCII、生成
- Preserve Readable Unicode は、最初にバンドルされている混同しやすいマップを適用し、次に文字を変更するときに NFKC 正規化を適用します。出力には、フラグが設定されていない非 ASCII 文字が含まれる場合があります。
- 厳密な ASCII フォールバックは同じ検出ルールを使用しますが、マップからの ASCII 置換を優先します。マップにない文字は、NFKC が変更しない限り、そのまま残ります。このモードはより厳密であり、なりすましテキスト クリーナー ワークフローに適しています。
- ホモグリフの生成では、入力を左から右に移動し、各 ASCII 文字または数字を、同じバンドルされたマップからの単一の決定論的なホモグリフに置き換えます (クリーンアップの逆)。代替が選択されていない文字は ASCII のままになります。
ここで何が疑わしいとみなされるか
クリーンアップ モードでは、定義された置換と混同しやすい文字であることがわかっている場合、または NFKC 正規化により文字が変更される場合 (全角数字など)、文字にフラグが立てられます。生成モードでは、ASCII 文字または数字が置き換えられた各位置に「疑わしい」マークが付けられます。これは完全な Unicode セキュリティ監査ではなく、決定的なルールのみです。
一般的な使用例
- 貼り付けられた文字列内のなりすましのユーザー名、ドメイン、またはホモグリフ攻撃をチェックします。
- 類似キャラクターのトリックに関するモデレーションと信頼性と安全性のレビュー。
- 開発者は、ホモグリフ検出ビューとともにエンコードの問題をデバッグします。
制限事項と安全上の注意事項
バンドルされているマップは、一般的なキリル文字、ギリシャ文字、および全角の類似文字をカバーしていますが、混同しやすい Unicode がすべて含まれているわけではありません。生成モードは認可されたテストのみを目的としています。人を騙したり、保護を回避したりするために使用しないでください。結果は決定論的であり、ML ベースのリスク スコアではありません。一か八かの決定を下す場合は、常に人間によるレビューを組み合わせてください。
プライバシー
すべての検出と変換は、ページの読み込み後に JavaScript でローカルに実行されます。テキストは処理のためにサーバーに送信されません。
よくある質問
同形文字とは何ですか?
ホモグリフは、ラテン語の「a」に似たキリル文字の「а」など、異なるスクリプトまたはエンコーディングの別の文字のように見える文字です。攻撃者はこれらをスプーフィングしたドメイン、ユーザー名、メッセージに使用します。このツールは、コード ポイントと置換によってこれらの文字を表示します。
これは Unicode 正規化とどう違うのでしょうか?
Unicode 正規化 (NFKC など) は、互換性と幅のバリアントを標準的な方法で折り畳みます。このツールは、NFKC を明示的で紛らわしい小さなマップと組み合わせているため、各文字にフラグが付けられた理由がわかります。これは、単純な Unicode 正規化ツール パスを超えて役立ちます。
厳密な ASCII モードは正規の非英語テキストを変更しますか?
厳密な ASCII フォールバックは、バンドルされた混同しやすいマップに表示される文字、または NFKC での変更を置き換えます。他の非 ASCII 文字は変更されません。正規のテキストにこれらのマップされた文字が含まれている場合は、変更される可能性があるため、分析リストを確認してください。
私のテキストはサーバーに送信されますか?
いいえ。ページが読み込まれた後の検出と変換には JavaScript のみが使用されます。この混同可能なコンバータは、分析のためにペーストをアップロードしません。
これであらゆるなりすましを捕まえることができるでしょうか?
いいえ。カバレッジは決定論的でマップベースであり、機械学習ではありません。これは一般的な類似文字トリックには役立ちますが、完全なセキュリティ監査ではありません。
同形文字の生成モードは何をしますか?
入力内の ASCII 文字と数字を、クリーンアップに使用された同じバンドル マップからの決定的な類似文字に置き換えます。これは、承認された環境 (モデレーション QA など) でテスト文字列を構築する場合に役立ちます。なりすましや保護の回避を目的としたものではありません。