Belefutottam egy ilyen kérdésbe: a tévé a pendrive-ról nem játssza le a feliratot, vagy furcsa karaktereket ír ki az ékezetek környékén. Egyértelmű, hogy a szöveges fájl karakterkódolásával van ilyenkor a gond, hiszen egy rendes, UTF-8-cal kódolt fájlnál nincs probléma az ékezetekkel sem.

Gondoltam, leírom, milyen lehetőségeket találtam, a későbbi korok okulására.

Alapvetően két egyszerű módszer létezik, az egyiknél fent van a gépeden a Pages, a másiknál nincs.

Ha megvan a Pages 

Ezeket a nem annyira szokványosan kódolt fájlokat arról is fel lehet ismerni, hogy a macOS alap szövegeket kezelő programja, a TextEdit meg sem tudja nyitni őket. Ilyen hibával dob vissza minket.

hiba.png

Azonban a fájlokat megnyitja a Pages, méghozzá úgy, hogy a karaktereket hibátlanul jeleníti meg. (A macOS-es preview, vagyis a fájlon ütött space is belenéz a fájlba, de abban az esetben a karakterek kuszák lehetnek.)

pages_1.png

A Pagesben válasszuk a File, Export to..., Plain Text lehetőséget, ekkor egy olyan fájlt hoz létre a program, aminek a nekünk helyes UTF-8-as kódolása van.

Ha nincs meg a Pages

Jól gondoljátok, Terminal következik. Indítsátok el. Alapból a Terminal a személyes mappátokban nyílik meg, ezt le tudjátok ellenőrizni az

ls

paranccsal. Ekkor kiírja az adott mappában lévő almappákat, fájlokat. Úgyhogy a legegyszerűbb, ha ide másoljuk az átalakítandó szöveges fájlokat (vagy a fájlt tartalmazó almappába megyünk a cd Movies/.../"az adott film mappájának a neve"), példánkban big.srt az áldozat, amit a szuadam mappába másoltam.

Először is nézzük meg, milyen a fájl kódolása. Ezt a 

file -I big.srt

paranccsal tehetjük meg (az ott egy nagy i betű).

kar.png

Láthatjuk, hogy példánkban ez iso-8859-1, vagy épp unknown-8 bit. Utóbbi nem hangzik jól. Akkor alakítjuk át UTF-8-ra. Így:

iconv -f original_charset -t utf-8 < originalfile > newfile

Példánkban

iconv -f iso-8859-1 -t utf-8 < i.srt > i2.srt

Az unknown-8bit esetében nem működik az "unknown-8bit" beírásával, nekem mázlim volt, és ugyanúgy sikeresen lefutott esetében az iso-8859-1-ről konvertálás.