Changeset 8163


Ignore:
Timestamp:
Jun 11, 2019, 7:32:25 PM (3 years ago)
Author:
kopal
Message:

HomophonicSubstitutionAnalyzer:

  • created first version of online help (German, English, and Russian)
File:
1 edited

Legend:

Unmodified
Added
Removed
  • trunk/CrypPlugins/HomophonicSubstitutionAnalyzer/userdoc.xml

    r8059 r8163  
    11<?xml version="1.0" encoding="utf-8" ?>
    2 
    3 <!-- You can edit this file manually or with the Util/CrypDocumentationEditor -->
    42<documentation>
    53  <language culture="en"/>
    64  <language culture="de-DE"/>
     5  <language culture="ru"/>
    76
    8   <introduction lang="en">   
     7  <introduction lang="en">
     8    The homophonic substitution cipher replaces each plaintext letter using different ciphertext symbols. Here, for example, a ciphertext letter consists of two-digit numbers from 01 to 99.<newline/>
     9    Plaintext alphabet: ABCDEFGHIJKLMNOPQRSTUVWXYZ<newline/>
     10    Key:                        A = {01 or 02 or 06}, B = {03 or 04}, C = {05}, ...<newline/>
     11    Plaintext:          HELLOWORLDHOWAREYOU<newline/>
     12    Ciphertext:         15,09,23,24,29,45,30,35,23,07,16,29,46,01,36,10,49,30,41<newline/>
     13    <newline/>
     14    Homophonic substitution ciphers are, when used with a considerably high number of homophones, hard to break, even today. Since they were used in many historical correspondences as the cipher of first choice, many of these historical texts are still unbroken.<newline/>
     15    <newline/>
     16    A homophonic substitution cipher tries to eliminate the possibility to analyze the ciphertext using simple language statistics. To do so, it flattens the frequencies of single letters, thus, in the perfect case, the ciphertext letters are uniformly distributed. For example, instead of encrypting the letter ’E’ only with one ciphertext letter, it can now be encrypted using one of several different “homophones”, e.g. ’01’, ’02’, ’03’, ’04’, ’05’. Then the ciphertext consists of different pairs of digits – this method was often used in history, i.e. in letters kept in the Vatican’s secret archive or in messages of the Spanish CivilWar encrypted with the Spanish Strip Cipher. The keyspace size of a homophonic cipher can be calculated by 26n where n is the number of homophones. For example, a homophonic encrypted text having only 52 homophones has a keyspace size of 26^52 = 2^244, where each homophone may be mapped to one of the 26 letters of the Latin alphabet.<newline/>
     17    <newline/>
     18    Fortunately, the letters or symbols of homophonic encrypted texts are not fully equally distributed. Thus, having enough ciphertext material, it is still possible to break it. The homophonic substitution analyzer uses a hillclimbing algorithm with a simulated annealing-based acceptance function to actually break homophonic substitution ciphers.
    919  </introduction>
    1020
    11   <introduction lang="de-DE">   
     21  <introduction lang="de-DE">
     22    Die homophone Substitutionschiffre ersetzt jeden Klartextbuchstaben unter Verwendung verschiedener Geheimtextsymbole. Hier besteht beispielsweise ein Geheimtextbuchstabe aus zweistelligen Zahlen von 01 bis 99. <newline/>
     23    Klartextalphabet: ABCDEFGHIJKLMNOPQRSTUVWXYZ <newline/>
     24    Schlüssel: A = {01 oder 02 oder 06}, B = {03 oder 04}, C = {05}, ... <newline/>
     25    Klartext: HELLOWORLDHOWAREYOU <newline/>
     26    Geheimtext: 15,09,23,24,29,45,30,35,23,07,16,29,46,01,36,10,49,30,41 <newline/>
     27    <newline/>
     28    Homophone Substitutions-Chiffren sind auch heute noch schwer zu brechen, wenn sie mit einer großen Anzahl von Homophonen verwendet werden. Da sie in vielen historischen Korrespondenzen als Chiffre der ersten Wahl verwendet wurden, sind viele dieser historischen Texte immer noch ungebrochen. <newline/>
     29    <newline/>
     30    Eine homophone Substitutions-Chiffre versucht, die Möglichkeit zu beseitigen, den Geheimtext mit einfachen Sprachstatistiken zu analysieren. Zu diesem Zweck werden die Häufigkeiten einzelner Buchstaben abgeflacht, sodass die Geheimtext-Buchstaben im Idealfall gleichmäßig verteilt sind. Anstatt beispielsweise den Buchstaben "E" nur mit einem Geheimtext-Buchstaben zu verschlüsseln, kann er jetzt mit einem von mehreren verschiedenen "Homophonen" verschlüsselt werden, z. "01", "02", "03", "04", "05". Dann besteht der Geheimtext aus verschiedenen Ziffernpaaren - diese Methode wurde oft in der Geschichte verwendet, d. H. In Briefen, die im Geheimarchiv des Vatikans aufbewahrt werden, oder in Nachrichten des spanischen Bürgerkriegs, die mit der spanischen Strip-Chiffre verschlüsselt sind. Die Schlüsselraumgröße einer homophonen Chiffre kann mit 26^n berechnet werden, wobei n die Anzahl der Homophone ist. Beispielsweise hat ein homophonisch verschlüsselter Text mit nur 52 Homophonen eine Schlüsselraumgröße von 26^52 = 2^244, wobei jedes Homophon einem der 26 Buchstaben des lateinischen Alphabets zugeordnet werden kann. <newline/>
     31    <newline/>
     32    Glücklicherweise sind die Buchstaben oder Symbole homophoner verschlüsselter Texte nicht perfekt gleichmäßig verteilt. Mit genügend Geheimtextmaterial ist es also immer noch möglich, sie zu zerbrechen. Die Homophone Substitutionsanalyse verwendet einen Hillclimbing-Algorithmus mit einer simulierten Annealing-basierten Akzeptanzfunktion, um homophone Substitutions-Chiffren aufzubrechen.
     33  </introduction>
     34
     35  <introduction lang="ru">
     36    Шифр с гомофонической заменой заменяет каждую незашифрованную букву различными символами зашифрованного текста. Здесь, например, буква зашифрованного текста состоит из двузначных чисел от 01 до 99. <newline/>
     37    Открытый текст: ABCDEFGHIJKLMNOPQRSTUVWXYZ <newline/>
     38    Ключ: A = {01 или 02 или 06}, B = {03 или 04}, C = {05}, ... <newline/>
     39    Plaintext: HELLOWORLDHOWAREYOU <newline/>
     40    Зашифрованный: 15,09,23,24,29,45,30,35,23,07,16,29,46,01,36,10,49,30,41 <newline/>
     41    <newline/>
     42    Шифры с гомофонической заменой при использовании со значительно большим количеством гомофонов трудно взломать даже сегодня. Поскольку они использовались во многих исторических соответствиях в качестве шифра первого выбора, многие из этих исторических текстов до сих пор не сломаны. <newline/>
     43    <newline/>
     44    Шифр с гомофоническим замещением пытается исключить возможность анализа зашифрованного текста с использованием статистики простого языка. Для этого он выравнивает частоты отдельных букв, поэтому в идеальном случае буквы зашифрованного текста распределяются равномерно. Например, вместо того, чтобы шифровать букву «E» только одной буквой зашифрованного текста, теперь она может быть зашифрована с использованием одного из нескольких «гомофонов», например, ’01’, ’02’, ’03’, ’04’, ’05’. Затем зашифрованный текст состоит из разных пар цифр - этот метод часто использовался в истории, т. Е. В письмах, хранящихся в секретном архиве Ватикана, или в сообщениях испанской CivilWar, зашифрованных с помощью испанского шифра Strip. Размер пространства ключей гомофонического шифра можно рассчитать по 26n, где n - количество гомофонов. Например, зашифрованный гомофонический текст, имеющий только 52 гомофона, имеет размер пространства клавиш 26^52 = 2^244, где каждый гомофон может быть сопоставлен с одной из 26 букв латинского алфавита. <newline/>
     45    <newline/>
     46    К счастью, буквы или символы гомофонических зашифрованных текстов распределены не полностью одинаково. Таким образом, имея достаточное количество зашифрованного материала, все еще можно его сломать. Анализатор гомофонического замещения использует алгоритм ограничения холма с симулированной функцией принятия на основе отжига, чтобы фактически сломать шифры гомофонического замещения.
    1247  </introduction>
    1348
    1449  <usage lang="en">
     50    The analyzer presentation has three &quot;tabs&quot;, each tab shows a different user interface. The tabs can be changed by clicking on the tab names on the maximized presentation of the component.<newline/>
     51    <newline/>
     52    The &quot;Analyzer&quot;tab consists of three main parts: (1) the top par contains some control buttons and an indicator field, showing the status of the cryptanalysis (percentage value of done hillclimbing cycles), (2) the given ciphertext, and (3) the putative plaintext. Depending on the mode in which the analyzer is executed (see the component’s parameters), the user can start and stop the analysis manually by clicking on the &quot;Analyze/Stop&quot;toggle button. This is only possible in the so-called semi-automatic or interactive mode: When stopped the user can &quot;lock&quot;already correct letters, which then appear with a green background. Non-locked letters appear with a white background. &quot;Locked&quot;means, that the analyzer won’t change these plaintext letters during restarts of the further analysis process. Also, the user is able to connect a dictionary to the analyzer. Then, the analyzer automatically locks words of defined lengths, that it reveals during the analysis. The user can set a minimum, how often a word has to appear in the plaintext, before the analyzer locks it. Thus, &quot;random words&quot;that may appear during the start of the analysis won’t be locked since these are most probably wrong. <newline/>
     53    <newline/>
     54    The &quot;Key letter distribution&quot;tab allows the modification of the initial used letter distribution in the random generated keys for the hill climbing.<newline/>
     55    <newline/>
     56    The third tab of the analyzer shows a collection of &quot;best&quot;putative plaintexts (and the according keys) found during the analysis so far. This tab has the title &quot;Bestlist&quot;. As it is also possible to start the analyzer in a full-automatic mode, this bestlist will probably contain a text close to the correct plaintext after several automatic &quot;restarts&quot;.<newline/>
     57    To break ciphers using the homophonic substitution analyzer, the user has to drag it onto the workspace, Then, it has to be connected to a TextInput for the ciphertext, a dictionary for the automatic word locker, and different TextOutput components for putative plaintext, key, and found words.<newline/>
     58    <newline/>
     59    The component works in two different modes: semi-automatic and fully-automatic. In the semi-automatic mode, the user has to start and stop the analysis process manually using the Analyis-button in the presentation. In the fully-automatic mode, the component works completely on its own. In the semi-automatic mode, the user is able to automatic lock and unlock already revealed plaintext letters. To do so, the user has to left-click onto the corresponding plaintext letters. Using the right mouse button, the user is also able to change the locked letters in alphabetical order. If the user presses the shift-key while right-clicking a letter, he changes the letter in reversed alphabetical order.
    1560  </usage>
    1661
    1762  <usage lang="de-DE">
     63    Die Analysekomponente besitzt drei &quot;Registerkarten&quot;, wobei jede Registerkarte eine andere Benutzeroberfläche zeigt. Die Registerkarten können durch Klicken auf die Registerkartennamen in der maximierten Darstellung der Komponente geändert werden. <newline/>
     64    <newline/>
     65    Die &quot;Analyse&quot;-Registerkarte besteht aus drei Hauptteilen: (1) Der obere Teil enthält einige Steuerelemente öpfe und ein Anzeigefeld, das den Status der Kryptoanalyse (Prozentwert der durchgeführten Hillclimbing-zyklen), (2) den angegebenen Chiffretext und (3) den vermutlichen Klartext anzeigt. Abhängig von dem Modus, in dem die Analyse ausgeführt wird (siehe die Parameter der Komponente), kann der Benutzer die Analyse manuell starten und stoppen, indem er auf &quot;Analysieren/Stoppen&quot;klickt. Dies ist nur im sogenannten halbautomatischen oder interaktiven Modus möglich: Wenn die Analyse angehalten ist, kann der Benutzer Buchstaben &quot;sperren&quot;., die dann grün hinterlegt werden. Nicht gesperrte Buchstaben werden mit einem weißen Hintergrund angezeigt. &quot;Gesperrt&quot;bedeutet, dass die Analyse diese Klartextbuchstaben während des Neustarts des weiteren Analyseprozesses nicht mehr ändert. Außerdem kann der Benutzer ein Wörterbuch an die Analyse anschließen. Die Analyse sperrt dann automatisch Wörter definierter Länge, die er während der Analyse gefunden wurden. Der Benutzer kann eine minimale Zahl festlegen, wie oft Wörter im Klartext erscheinen sollen, bevor der Analysator diese sperrt. Somit können zufällig entstehende Wörter, die während der Analyse auftreten, automatisch ignoriert werden.<newline/>
     66    <newline/>
     67    Mit der Registerkarte &quot;Schlüsselbuchstabenverteilung&quot; können Sie die initiale Verteilung der Buchstaben in den zufällig generierten Schlüsseln für das Hillclimbing ändern. <newline/>
     68    <newline/>
     69    Die dritte Registerkarte der Analyse zeigt eine Sammlung von &quot;besten&quot;mutmaßliche Klartexte (und die dazugehörigen Schlüssel), die bei der bisherigen Analyse gefunden wurden. Diese Registerkarte heißt &quot;Bestenliste&quot;. Da es auch möglich ist, die Analyse im vollautomatischen Modus zu starten, enthält diese Bestenlisten sehr wahrscheinlich einen Text, der nach mehreren automatischen &quot;Neustarts&quot;nahe am korrekten Klartext liegt. <newline/>
     70    Um Geheimtexte mit der Homophonen Substitutionsanalyse zu brechen, muss der Benutzer sie auf den Arbeitsbereich ziehen. Anschließend muss sie mit einer Texteingabe für den Geheimtext, einem Wörterbuch für die automatische Wortsperre und verschiedenen Textausgabe-Komponenten für den mutmaßlichen Klartext, Schlüssel und gefundene Wörter verbunden werden. <newline/>
     71    <newline/>
     72    Die Komponente arbeitet in zwei verschiedenen Modi: halbautomatisch und vollautomatisch. Im halbautomatischen Modus muss der Benutzer den Analyseprozess manuell über den Analysieren-Button in der Präsentation starten und stoppen. Im vollautomatischen Modus arbeitet die Komponente völlig eigenständig. Im halbautomatischen Modus kann der Benutzer bereits aufgedeckte Klartextbuchstaben automatisch sperren und entsperren. Dazu muss der Benutzer mit der linken Maustaste auf die entsprechenden Klartextbuchstaben klicken. Mit der rechten Maustaste kann der Benutzer auch die gesperrten Buchstaben in alphabetischer Reihenfolge ändern. Wenn der Benutzer die Umschalttaste drückt, während er mit der rechten Maustaste auf einen Buchstaben klickt, ändert er den Buchstaben in umgekehrter alphabetischer Reihenfolge.
    1873  </usage>
    19  
     74
     75  <usage lang="ru">
     76    Презентация анализатора имеет три «вкладки», каждая вкладка отображает свой пользовательский интерфейс. Вкладки можно изменить, нажав на названия вкладок в развернутом представлении компонента. <newline/>
     77    <newline/>
     78    &quot;Анализатор &quot;Вкладка состоит из трех основных частей: (1) верхняя часть содержит несколько кнопок управления и поле индикатора, показывающее состояние криптоанализа (процентное значение выполненных циклов подъема в гору), (2) заданный зашифрованный текст и (3) предполагаемый простой текст. В зависимости от режима, в котором выполняется анализатор (см. Параметры компонента), пользователь может запускать и останавливать анализ вручную, нажав кнопку «Анализировать / Остановить». Кнопка-переключатель. Это возможно только в так называемом полуавтоматическом или интерактивном режиме: когда пользователь остановлен, он может «заблокировать»; уже правильные буквы, которые затем появляются на зеленом фоне. Неблокированные буквы отображаются на белом фоне. &quot;Locked &quot;означает, что анализатор не изменит эти незашифрованные буквы при перезапуске дальнейшего процесса анализа. Также пользователь может подключить словарь к анализатору. Затем анализатор автоматически блокирует слова определенной длины, которые он обнаруживает во время анализа. Пользователь может установить минимум, как часто слово должно появляться в открытом тексте, прежде чем анализатор заблокирует его. Таким образом, «случайные слова» которые могут появиться в начале анализа, не будут заблокированы, поскольку они, скорее всего, ошибочны. <newline/>
     79    <newline/>
     80    &quot;Распределение буквенных ключей &quot;Вкладка позволяет изменять начальное распределение используемых букв в случайно сгенерированных ключах для восхождения на холм. <newline/>
     81    <newline/>
     82    Третья вкладка анализатора показывает коллекцию «лучших» предполагаемые открытые тексты (и соответствующие ключи), найденные в ходе анализа до настоящего времени. Эта вкладка имеет заголовок &quot;Bestlist &quot;. Поскольку также возможно запустить анализатор в полностью автоматическом режиме, этот список будет, вероятно, содержать текст, близкий к правильному открытому тексту после нескольких автоматических «перезапусков». <newline/>
     83    Чтобы взломать шифры с помощью анализатора гомофонического замещения, пользователь должен перетащить его в рабочую область. Затем он должен быть подключен к TextInput для зашифрованного текста, словарю для автоматической блокировки слов и различным компонентам TextOutput для предполагаемого открытого текста, ключа и найденные слова. <newline/>
     84    <newline/>
     85    Компонент работает в двух разных режимах: полуавтоматический и полностью автоматический. В полуавтоматическом режиме пользователь должен запускать и останавливать процесс анализа вручную, используя кнопку Analyis в презентации. В полностью автоматическом режиме компонент работает полностью самостоятельно. В полуавтоматическом режиме пользователь может автоматически блокировать и разблокировать уже обнаруженные незашифрованные буквы. Для этого пользователь должен щелкнуть левой кнопкой мыши по соответствующим буквам текста. Используя правую кнопку мыши, пользователь также может изменять заблокированные буквы в алфавитном порядке. Если пользователь нажимает клавишу Shift при щелчке правой кнопкой мыши по букве, он меняет букву в обратном алфавитном порядке.
     86  </usage>
     87
    2088  <presentation lang="en">
    2189  </presentation>
    22  
     90
    2391  <presentation lang="de-DE">
    2492  </presentation>
    25  
     93
     94  <presentation lang="ru">
     95  </presentation>
     96
    2697  <references>
    2798  </references>
Note: See TracChangeset for help on using the changeset viewer.