(1)In (2)diesem (3)Text (4)werden (5)alle (6)Wörter, (7)welche (8)mehrfach (9)auftreten (10)durch (11)die (12)Position (13)ihres (14)ersten (15)Auftretens (16)im >3< (18)ersetzt. (19)Mich (20)interessiert (21)dabei, (22)wie (23)lang (24)wohl (25)ein >3< (27)sein (28)muss, (29)damit (30)verschiedene (31)Meilensteine (32)erreicht >4<. (34)Als (35)solche >31< (37)würde (38)ich (39)unter (40)anderem (41)folgende (42)vorschlagen:
- >5< (44)Artikel (45)und (46)Konjunktionen >4< >34< (49)Zahl (50)geschrieben
- (51)Der >3< (53)wird (54)komplett (55)unlesbar >45< (57)verkommt (58)zu (59)einer (60)Entschlüsselungsaufgabe;
- (61)Es (62)treten (63)keine (64)Pronomen >45< (66)Präpositionen (67)mehr >34< (69)ausgeschriebenes (70)Wort (71)auf;
- (72)>67< >34< >11< (75)Hälfte (76)aller (77)Worte (78)sind >10< (80)Zahlen >18<
- >61< >62< (84)nahezu >63< (86)ausgeschriebenen >77< >67< >71< ((90)das (91)Verhältnis (92)ausgeschriebener >6< >58< >80< (96)welches (97)jemanden (98)dies (99)so (100)wahrnehmen (101)lässt, (102)steht (103)zur (104)Debatte);
- >51< >3< >53< (108)wieder (109)halbwegs (110)flüssig (111)lesbar (112)für (113)Menschen, >11< (115)ihn (116)bis (117)dahin (118)entziffert (119)haben ((120)weil (121)sie >11< (123)meisten (124)Substitutionen (125)schon (126)auswendig (127)kennen).
>11< (129)Reihenfolge, >1< (131)welcher (132)diese >31< >9<, >28< >21< (137)auch (138)nicht >51< (139)hier (140)gewählten (141)entsprechen, (142)sondern (143)müsste (144)ebenfalls >10< (146)einen (147)ausreichend (148)langen >99< (150)konstruierten >3< (152)ermittelt >4<. (154)Natürlich (155)ist (156)dieser (157)ganze (158)Vorgang (159)vermutlich (160)ziemlich (161)müßig, >120< >61< (164)sich (165)um >54< (167)konstruierte (168)Fragestellungen (169)über (170)ein >54< (172)konstruiertes (173)Konzept (174)handelt.
(175)Möglicherweise (176)lassen >164< (178)Erkenntnisse >169< >11< (181)Sprache (182)des (183)Textes (184)ableiten, (185)z.B. >11< (187)Häufigkeit (188)mit >51< >164< >6< (>1< (193)exakt (194)gleicher (195)Form) (196)wiederholen, (197)aber >11< (199)Methode >53< (201)kaum (202)effizient >112< >90< (205)Erlangen (206)solcher (207)Kenntnisse >27<. (209)Interessant, >197< >144< (212)unpraktikabel (213)könnte (214)zudem >11< (216)Beobachtung (217)>182< (219)Leserverhaltens >27<, >185< >51< (223)Punkt, (224)ab (225)dem >51< >3< (228)unleserlich >53<. (230)Ob >164< (232)daraus (233)jedoch (234)neue >178< >169< (237)Sprachverstehen (238)oder (239)anderes >184< (241)ließen, >155< >232< (244)Fragwürding. >1< (246)jedem (247)Fall (248)wäre >61< >54< (251)unwissenschaftlich, >25< (253)Experiment >58< (254)machen, (255)ohne (256)vorher (257)festzulegen, >7< (259)Hypothese >29< (261)untersucht >4< (263)soll. >197< >154< >78< >132< (268)Texte >63< (270)wissenschaftlichen (271)Experimente, >142< (273)lediglich (274)kleine (275)Spielereien >188< >181< >257< (279)höheren (280)Anspruch >71< (282)Erkenntnisgewinn >238< (284)dergleichen.
(285)Da >121< >197< (288)durchaus >138< >34< (291)Unterhaltung (292)gedacht >78<, (294)möchte >38< >90< >173< >139< >137< >71< >11< (302)Spitze (303)treiben, >285< (305)sonst (306)jede (307)mögliche (308)Freude (309)am (310)Lesen >10< >11< (313)langwierige >45< (315)sinnlose (316)Entzifferungsarbeit (317)zunichte (318)gemacht >53<. (320)Wenn (321)mal (322)jemand >25< (324)paar (325)Stunden (326)Zeit (327)verschwenden (328)will, (329)kann >132< (331)Person (332)ja >146< (334)Parser (335)schreiben, >51< >132< (338)Ersetzungen (339)automatisch (340)vornimmt, >45< (342)mir (343)dann >170< (345)Version (346)von „(347)Sleepless >1< (349)Saarbrücken“ (350)per (351)E-Mail (352)schicken, >11< (354)noch (355)erheblich (356)unlesbarer >155< >34< >90< (360)Original (361)bereits.
Trivial-Algorithmus (C#): http://pastebin.com/7hVdJjMz
Als ausführbares Programm: http://www.file-upload.net/download-9794853/EulenText.exe.html
Wenn ich selbst in der Situation des Lesers dieses Kommentars wäre, würde ich allerdings keine .exe-Dateien die mir ein Fremder im Internet anbieten möchte ausführen.
Ausgabe: http://pastebin.com/b7DJMCwU
Das erste Wort eines Absatzes wird nicht richtig behandelt, und solche Sachen wie „(or“ werden als ein Wort erkannt, da einfach an den Leerzeichen getrennt wird anstatt korrekt die Wörter zu identifizieren.
Ich habe keine Lust, es zu verbessern.
Viele Grüße
Wow. Hätte nicht erwartet das das tatsächlich jemand macht, und dann auch noch so schnell. Vielen Dank, die „Sleepless in Saarbrücken“ Version sieht ziemlich abartig aus.
Ich möchte als interessante Information, die ich erst nach dem Schreiben dieses Textes entdeckt habe, die aber hohe Relevanz hat und und durchaus einige der darin gestellten Fragen beantwortet, dieses Video als Einstieg in die Wunderbare Welt von Zipf’s law darbieten: https://www.youtube.com/watch?v=fCn8zs912OE