返回信息流因为觉得技术含量实在不够高到可以到计算机板块发帖,还是默默在乡版记录一下吧~
嘛,本来这么臭长(惆怅)的东西是没必要贴出来的。但是随手在破解的时候记录了点东西,整理了一下,觉得不发有点可惜。
2014.8.25,22:00
好久没做过单字母替换类的密文破解题目了。上次做的时候还是在高中,不过文章比这篇短一些,而且单词之间有空格。这点是特别关键的,难度跟今天的题目完全是不一样的。
原文:
初拿到题目,感觉真是一头雾水。没有空格= =,这是最蛋疼的地方。但是这类题目的解题思路就是统计,然后猜- -。。好吧。我把原文字数统计了一遍,459,以及每个字母出现的字数,以及所占的概率。根据题目给的英文字母频率的表,首先是要找出E这个字母。
英文字频:
原文字频:
我首先审视了前四个高频字母。FQCW。我的想法是E一定在这四个字母里面。在对比了F,Q,C,W出现的情况后,我发现Q出现了双连,三连的情况,直觉上认为这是E。但是其余的字母却无法解释。一开始就卡住。于是我把目光注视到原文本身,发现Q这个字母真的是很特殊。XQCQCQ,RQQQR这两段序列把我搞得很乱。QQQ应该是前一个单词是QQ结尾,后一个单词是Q开头。但是这样的话,QRY是个什么单词,因为如果Q是E的话,有什么单词结尾是EE,后来又跟上一个3个字母的E开头的单词。整个晚上几乎在这里面绕死了。另外还发现了FCAW,FCAWA这两个序列,FCAW算是个高频序列。只是还是无法确定这几个字母是什么,试了很多的情况,但是一个晚上几乎没收获。凌晨12点半,实在熬不住,睡了。
8:30
上午破解进度,把几个高频字母周围的字母情况列出来了:
QFCWA这前五个高频字母,
与Q相邻的不同字母有16个
与F相邻的不同字母有16个
与C相邻的不同字母有17个
与W相邻的不同字母有12个
与A相邻的不同字母有13个
基本可以认为QFC是元音字母,因为原文没有D,G这两个字母,字母总数只有24个,然后WA是辅音的概率很大。QFC如果是元音的话,由于Q出现了三连,二连的情况,相比A,O这两个高频元音,E的概率更大,所以还是认为,Q=E。然后我又统计了一下Q前出现的字母,以及Q后出现的字母发现W这个字母在Q前出现了4次,在Q后没有出现其余的字母是正常的,也就是说W很有可能是H,倘若这样,那么A是T也就说得过去了。AWQ原文出现了三次,对应过来是THE。貌似说得过去。
另外,QTQ不是一个单词开头或者结尾,而是Q是一个单词结尾,TQ是另一个开头
我找到了两段序列,结尾是RVQ结尾,如果CYPNAUMRV是独立的一个词组,那么Q就被独立出来了,那么就不符合事实了,由此,QTQ至少是两个单词的部分。由此,这篇密文的结构我也有了重新的审视,段落的断句并非是按照单词结束来断句的,而是出题者随便断的句子。
然后文中YNHPFAZNXPO这个序列出现了6次,这应该不是一个单词。昨天一个学弟提醒了我,例如I HAVE A DREAM,只是把空格略去了,独立性很强,说明很可能是个短语。
15:30
下午睡了一觉继续来。
八哲提供一幅程序执行后的图。把双字符以上的情况出现多少次列出来了。但是我现在还是有些部分没法解释。把Q->E,A->T,W->H后,F,C我还是无法确定是否是A,O这两个元音。另外,FC经常连在一起。这点很头疼。
由于遇到了瓶颈,我决定把X这个字母出现的情况也列出来。
与X相邻的不同字母数有14个。= =真是蛋疼。还是看不出什么。
但是X有一点值得推敲,就是NX出现了9次,而XN只出现了1次,说明NX是个相对固定形式。 有可能是IS。猜测。但是鉴于YNHPFWZNXPO这个序列出现了6次,说明如果是IS,那么PO也得是一个独立词汇,这点的可能性太低。于是暂且搁置。
检查了一下原文词频表,发现自己把高频的R给忘了。
于是就又手动统计了一遍。结果有着惊人的发现。与R相邻的有21个不同的字母,21个!说明这个字母非常活跃,有着E的性质。并且在一段序列处我貌似觉得R才是E。这段序列是XJJNRQQ,这段序列的Q,之前一直被我猜想为E,但是如果Q并非是E的话,而R才是E,那么这段序列很可能是ADDRESS,地址。于是得到了5个字母的对应关系。X->A,J->D,N->R,R->E,Q->S。接下来我要把这个猜想付诸实践,把原文替换一下,看下是不是这样。如果是的话,那么就推翻了我自己之前一直坚定的Q是E的想法了。
这可能是第一个突破点。
18:30
在拿到苏的字母排序替换程序后,以及八哲自己推理的几个字母,
我把我们3个人的想法整合了一下,我取了我与八哲都共同推出来的R与Q,并且借鉴了他对于F和O的推断。果然在address的前面出现了一个完整的单词,that。that address,还是个成型的短语,看来成功在望。苏给的程序能够很轻松得替换字母给出结果,这让我的破解工作进度得以高速运转。
果然,一切开始浮上水面。
19:30
在that address这个短语下面一行,有一段短语引起了我的注意。
YrHPtAZraPhCYsHsteV,首先YrHPtAZraPhCY在原文中重复有出现过,于是太长先不看。sHsteV,这段东西让我瞬间想到了一个单词,system,系统,虽然是个猜想,但是合情合理,于是我把这块,H->y,V->m带入程序运行。
在SYSTEM后面出现了smTst。看来SYSTEM在这里是复数。于是后面的东西,mTst,一眼看去就是个must,
按照这思路程序运行后,我又发现了一段序列,struYt,前后我假定跟这段序列无关,也就是struYt是个独立单词,于是,struct就诞生了。
继续,开头居然出现了cryPtAZraPhy,这段序列初看很别扭,一开始我还一直在纠结在cry是哭上面,后来看到ZraPh想到了graph这个东西,再回看,于是cryptogrphy这个单词就出来了。
并且这个单词的意思是密码学,非常合题,我感觉此题基本上结束了。把新破解的字母输入程序,几乎都出来了,剩下的就是把一些字母再弄出来就行了。
securCty,proUMems,一眼就是security,problems,于是再解决3个字母。
再来就看到了coWcept这个序列,于是W->n了。再检查一遍,发现是合情合理的。
再仔细审查原文,发现了一个tasK,因为原文的P对应过来还是p,所以还会有一个字母是不变的,看来就是K。后面还有一段序列,solIing,那么I就是v了,solving。
那么现在只剩E和B没有破译了。由于B在原文只出现一次,先不考虑,先看看E。EirmEoundation,看来就是f了,firm foundation。
那么只剩B了。B由一个学弟提醒,是不是z,我放进去发现,BINGO。
至此全文破译完成。
整理一下:
果然能有一个突破口就是快。从that address 开始不到两个小时就把全文破译完毕,但是我之前做了很多的“无用功”,感觉还是有点不舒服。不过最后破译完成的感觉真是非常的爽!
此题的关键在于THE,以及address的确定,感谢八折贡献了THE的三份二,TH的确定,我是摘取他的想法的。另外还要感谢苏神给的题目来练手以及所给的替换程序能够快速替换字母,省去了不少时间~总之还是挺有收获的~[ema3]
这是一条镜像帖。来源:北邮人论坛 / fujian / #454727同步于 2014/8/26
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Fujian机器人发帖
【P.D】记一段密文破译的经历
PiEgg
2014/8/26镜像同步128 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复