Windows 10 Insider Preview Build 18875 (20H1)
Στο επεισόδιο 9 της δεύτερης σεζόν του Log Horizon, όταν ...
Η Shiroe πέθανε και εμφανίστηκε στον ανεπίσημο 14ο διακομιστή του Elder Tale, του δοκιμαστικού διακομιστή, ο οποίος είχε οριστεί να είναι στη Σελήνη αντί στη Γη,
... έλεγξε την τοποθεσία και ο διάλογος ήταν κυρίως αλλοιωμένος, αποθηκεύτηκε για το όνομα της τοποθεσίας Μάρα Τρανκιλιτάτης.
Μπορεί το αλλοιωμένο κείμενο να αποκρυπτογραφηθεί ή είναι απλά σκουπίδια;
Ναι, το αλλοιωμένο κείμενο είναι το αποτέλεσμα του mojibake, όπου το πρωτότυπο κείμενο στα Ιαπωνικά, που κωδικοποιείται σε κωδικοποίηση Shift-JIS, αποκωδικοποιείται από την κωδικοποίηση των Windows-1256.
Εάν ανοίξετε ποτέ ιαπωνική ιστοσελίδα ή αρχείο κειμένου που κωδικοποιείται σε κωδικοποίηση Shift-JIS (σύνολο χαρακτήρων 2 byte) κάτω από κάποια κωδικοποίηση Western στα Windows (σύνολο χαρακτήρων 1 byte), θα δείτε υψηλή συχνότητα ��
συνδυάστηκε με κάποιον άλλο χαρακτήρα στην προβολή που προκύπτει. Δεδομένου ότι παρατηρώ ότι υπάρχουν αραβικοί χαρακτήρες στην εικόνα, χρησιμοποίησα ένα από τα υπάρχοντα αρχεία κειμένου μου που είναι κωδικοποιημένο στο Shift-JIS και προσπάθησα να το ανοίξω με κωδικοποίηση αραβικών (Windows) στο πρόγραμμα περιήγησης και ανακάλυψα ότι τα αραβικά (Windows) ή η κωδικοποίηση Western έχει την ίδια αντιστοίχιση για ��
και ��
(που είναι ένας άλλος κοινός χαρακτήρας στο αλλοιωμένο κείμενο).
Αφού συνέκρινα με το σωστά παραδοθέν παράθυρο κατάστασης τοποθεσίας και κάποια εικασία, κατάφερα να αποκωδικοποιήσω το αλλοιωμένο κείμενο σε κατάλληλο ιαπωνικό κείμενο (οι αγκύλες και προστίθενται για σαφήνεια και δεν αποκωδικοποιούνται από αλλοιωμένο κείμενο):
������������������ ��������������� ��������������� ��������������� ������������ ���������������/��������������������������� ��������������� ������������������������ ������������������������ ���������������/������������ ���������������/������������
Μετάφραση:
Moon Server Moon Server Isolated zone/No monster PVP allowed Special skills allowed Entry restriction/Restricted Exit restriction/Restricted
παράρτημα
Για να ελέγξετε το αποτέλεσμα, μπορείτε να χρησιμοποιήσετε το ακόλουθο κομμάτι του κώδικα Python 3:
garbled = '��T��[��o��[\n������T��[��o��[\n��]��[�����\n������T��[��o��[\n����������\n�����������]��[�����/������������X��^��[��o��������������\n���������������\n�����������s������������\\���������\n��@���S��������Z��g���p��������\\\n��@��i����������������/�����������\xa0�����\n��@�������o�����������/�����������\xa0�����' print(garbled.encode('Windows-1256').decode('Shift-JIS'))
Παρακάτω είναι το μόνο για προβολή πηγή1 του mojibake για σύγκριση με την εικόνα:
1 Το παρακάτω κείμενο περιέχει U + 200E από αριστερά προς τα δεξιά σήμανση για να αποφευχθεί η απόδοση των αραβικών χαρακτήρων από τα δεξιά προς τα αριστερά και να αλλάξουν τα σχήματά τους με βάση τη θέση τους. Ένα άλλο πρόβλημα που αποτρέπει την ευθεία αντιγραφή οφείλεται στην παρουσία U + 00A0 No-Break Space, το οποίο μετατρέπεται σε διάστημα όταν αντιγράφεται από το πρόγραμμα περιήγησης.
�����T��������[��������o��������[��� ���������������T��������[��������o��������[��� �����]��������[�������������� ���������������T��������[��������o��������[��� ���������������������� ��������������������������]��������[��������������/������������������������������X��������^��������[��������o����������������������������������� ��������������������������������� ��������������������������s������������������������������\������������������������ �����@���������S��������������������Z��������g���������p��������������������\��� �����@��������i�������������������������������������/��������������������������������������������� �����@�������������������o��������������������������/���������������������������������������������
1 - "Επιτρεπόμενη PvP": Ναι. Αναρωτιέστε αν αυτό θα καταλήξει να είναι σημαντικό.