Done challenges 1 and 2
[cipher-tools.git] / 2019 / 2019-challenge9b.ipynb
index 10a38943f0cd7c428f7a7c11aeeac0325c49e95e..77d4004a306dfbc96f8c446754261e5ba129816d 100644 (file)
@@ -45,7 +45,7 @@
   },
   {
    "cell_type": "code",
-   "execution_count": 19,
+   "execution_count": 4,
    "metadata": {},
    "outputs": [],
    "source": [
     "open(plaintext_b_filename, 'w').write(lcat(tpack(segment(pb))))"
    ]
   },
+  {
+   "cell_type": "code",
+   "execution_count": 13,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "def ioc_n(text):\n",
+    "    counts = collections.Counter(text)\n",
+    "    ltrs = set(text)\n",
+    "    denom = len(text) * (len(text) - 1) / len(ltrs)\n",
+    "    return (\n",
+    "        sum(max(counts[l] * counts[l] - 1, 0) for l in ltrs)\n",
+    "        /\n",
+    "        denom\n",
+    "    )"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 24,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "def ioc_scan_n(text, max_key_length=20):\n",
+    "    \"\"\"Finds the index of coincidence of the text, using different chunk sizes.\"\"\"\n",
+    "    iocs = {}\n",
+    "    for i in range(1, max_key_length + 1):\n",
+    "        splits = every_nth(text, i)\n",
+    "        mean_ioc = sum(ioc_n(s) for s in splits) / i\n",
+    "        iocs[i] = mean_ioc\n",
+    "    return iocs"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 25,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "1.313469334794217"
+      ]
+     },
+     "execution_count": 25,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "ioc_n(scb)"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 30,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "text/plain": [
+       "[(28, 1.029237612412878),\n",
+       " (56, 1.0323741101856603),\n",
+       " (14, 1.0886873582571082),\n",
+       " (42, 1.0923459702787721),\n",
+       " (1, 1.313469334794217),\n",
+       " (3, 1.3136724474583705),\n",
+       " (5, 1.3139446514243536),\n",
+       " (7, 1.3141262063060093),\n",
+       " (2, 1.3142346883552642),\n",
+       " (9, 1.3145299178890573),\n",
+       " (6, 1.3146522525866469),\n",
+       " (11, 1.314872121624653),\n",
+       " (10, 1.3153476328760576),\n",
+       " (17, 1.3156082632437882),\n",
+       " (19, 1.3157537470690668),\n",
+       " (15, 1.3158533079430723),\n",
+       " (18, 1.316306072127611),\n",
+       " (4, 1.3163246528314725),\n",
+       " (23, 1.3163277281569055),\n",
+       " (21, 1.3163473471920573),\n",
+       " (25, 1.316655118103681),\n",
+       " (8, 1.317040603398334),\n",
+       " (13, 1.3171605413165643),\n",
+       " (12, 1.3174113735517243),\n",
+       " (22, 1.317528984722072),\n",
+       " (33, 1.317594905094905),\n",
+       " (31, 1.317605231763728),\n",
+       " (27, 1.317688521561938),\n",
+       " (29, 1.3179986584465913),\n",
+       " (16, 1.3180422696887168),\n",
+       " (35, 1.318663902511151),\n",
+       " (38, 1.3186715456762172),\n",
+       " (37, 1.318782979178807),\n",
+       " (30, 1.3189277795375356),\n",
+       " (20, 1.319112577563282),\n",
+       " (41, 1.319293715271584),\n",
+       " (24, 1.319320503943391),\n",
+       " (34, 1.319372128500673),\n",
+       " (26, 1.3195881414435318),\n",
+       " (45, 1.319847955451339),\n",
+       " (51, 1.3198862305977204),\n",
+       " (43, 1.3202263262432186),\n",
+       " (32, 1.3204297829974077),\n",
+       " (46, 1.32083091670564),\n",
+       " (47, 1.320835215197834),\n",
+       " (49, 1.3208992566951445),\n",
+       " (36, 1.320917879222574),\n",
+       " (39, 1.3212746271240052),\n",
+       " (57, 1.3216014658027582),\n",
+       " (55, 1.3216742585772436),\n",
+       " (50, 1.321775386202746),\n",
+       " (40, 1.3220152407245682),\n",
+       " (48, 1.322371313582251),\n",
+       " (54, 1.3229352276740334),\n",
+       " (59, 1.322950472958544),\n",
+       " (44, 1.3231503579952266),\n",
+       " (53, 1.3232741220713358),\n",
+       " (58, 1.3236374480105653),\n",
+       " (52, 1.3262568828142518),\n",
+       " (60, 1.3264573374508233)]"
+      ]
+     },
+     "execution_count": 30,
+     "metadata": {},
+     "output_type": "execute_result"
+    }
+   ],
+   "source": [
+    "sorted(ioc_scan_n(scb, max_key_length=60).items(), key=lambda kv: kv[1])"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": 33,
+   "metadata": {},
+   "outputs": [
+    {
+     "data": {
+      "image/png": "\n",
+      "text/plain": [
+       "<Figure size 432x288 with 1 Axes>"
+      ]
+     },
+     "metadata": {
+      "needs_background": "light"
+     },
+     "output_type": "display_data"
+    }
+   ],
+   "source": [
+    "ic = ioc_scan_n(scb, max_key_length=60)\n",
+    "plot_frequency_histogram(ic, sort_key=ic.get)"
+   ]
+  },
   {
    "cell_type": "code",
    "execution_count": null,