🔧Toolify

محلِّل تكرار الأحرف (حروف أو جميع الأحرف أو كلمات)

الصق أي نص للحصول على جدول تكرار مُرتَّب. ثلاثة أوضاع: جميع الأحرف، أو الحروف والأرقام فقط، أو الكلمات الكاملة. مفيد لتحليل الشفرات وتحليل الكتابة وتنظيف مجموعات البيانات.

كيف تعمل

ما استخداماتها

تحليل الشفرات: الشفرات الكلاسيكية (قيصر، الاستبدال) تحافظ على تكرار الحروف. النص الإنجليزي دائمًا فيه E أكثر الحروف شيوعًا، ثم T وA وO وI وN. إذا رأيت توزيعًا مشابهًا في النص المشفَّر، فعندك شفرة استبدال. اللغات العربية وCJK لها توزيعات مختلفة جدًا لكن لا تزال قابلة للتعرف.

تحليل الكتابة: رصد الكلمات المُفرَطة الاستخدام هو أسرع طريقة لتحسين المسودات. إذا ظهرت كلمة مثل 'جدًا' أو 'حقًا' 50 مرة في مقال من 1000 كلمة، فقد اكتشفت عادةً ينبغي إصلاحها.

تنظيف مجموعات البيانات: مسح عمود CSV بهذه الأداة يكشف الأحرف الزائفة وأخطاء الترميز والحالة غير المتوقعة. مفيد قبل استيراد البيانات في نظام أكثر صرامة.

الأوضاع الثلاثة

جميع الأحرف: يشمل المسافات وعلامات الترقيم وفواصل الأسطر والرموز التعبيرية. الأفضل للتحليل الخام للنص. مفيد حين تشتبه بأحرف مخفية (مسافة بلا عرض، BOM) تُفسد ملفًا.

الحروف والأرقام: يُصفِّي لحروف Unicode والأرقام فقط. الأفضل لتحليل تكرار الحروف التقليدي (تحليل الشفرات، تعريف اللغة).

الكلمات: يُقسِّم على المسافات ويحسب الكلمات الكاملة. الأفضل لتحليل الكتابة والفحص الأسلوبي.

ما تعنيه 'الحساسية للحالة'

معطَّل (افتراضي): 'A' و'a' يُحتسبان معًا. الأفضل لتكرار الحروف في النص الطبيعي حيث الحالة عَرَضية.

مُفعَّل: 'A' و'a' يُحتسبان منفصلَيْن. مفيد حين تكون الحالة ذات معنى — معرِّفات البرمجة والمصطلحات التجارية وتحليل أنماط الكتابة بالأحرف الكبيرة. ملاحظة: يستخدم الطي غير الحساس للحالة قواعد الأحرف الصغيرة للغة؛ وهو في معظم اللغات الطي القياسي لـ Unicode.

أسئلة شائعة

هل يعمل مع النصوص اليابانية والصينية والكورية؟

نعم. وضع الحروف يعامل كل رمز أيديوغرافي كـ'حرف' واحد، لذا تحصل على تكرار الحروف الصينية/اليابانية. وضع الكلمات يُقسِّم على المسافات، مما يعني أن نص CJK بلا مسافات يظهر ككلمة ضخمة واحدة — استخدم وضع الحروف لتلك.

ما أكثر الحروف شيوعًا في الإنجليزية؟

'E' (نحو 12.7%)، ثم T (9.1%)، A (8.2%)، O (7.5%)، I (7.0%)، N (6.7%). معرفة هذا هو أساس كسر شفرات الاستبدال البسيطة.

هل تُحتسب الرموز التعبيرية؟

نعم في وضع 'جميع الأحرف'. وضع الحروف يُصفِّيها (فهي ليست حروفًا وفق تصنيف Unicode).

لماذا تنقسم الرموز التعبيرية أحيانًا إلى أحرف متعددة؟

بعض الرموز التعبيرية تتكون من نقاط كود Unicode متعددة (مثلًا: الأعلام = حرفا مؤشر إقليمي). العداد يتبع تكرار سلاسل JavaScript الذي يحترم نقاط الكود لكن ليس كل مجموعات الغراف. لمعظم التحليلات هذا مناسب.

هل يمكنني تصدير الجدول؟

ليس بعد — انسخ الجدول المُقدَّم في الوقت الحالي. تصدير CSV مُدرَج في خارطة الطريق.

كم إدخالًا يُعرَض؟

أعلى 50 في الجدول. عدد الذيل مُلخَّص في الأسفل.

لماذا لا تتطابق النتائج غير الحساسة للحالة في اليونانية/التركية مع توقعاتي؟

لبعض اللغات قواعد حالة غير عادية (I ذو نقطة/بلا نقطة في التركية؛ ß ↔ SS في الألمانية). نستخدم toLowerCase() في JavaScript التي تتبع الطي الافتراضي لـ Unicode — مناسبة في الغالب لكنها قد تُفاجئك في الحالات الخاصة.

هل تغادر البيانات متصفحي؟

لا. جميع العمليات الحسابية تعمل محليًا.

أدوات ذات صلة

آخر تحديث:

جرّب مطالباتنا للذكاء الاصطناعي ←