Seltsame mp3-Tags: Ãîðîä (russisch?)

+A -A
Autor
Beitrag
stefle
Stammgast
#1 erstellt: 26. Okt 2008, 19:02
Hab da so ein paar russische (oder anderweitig osteuropäische) mp3-Files mit Tags, die z.B. so aussehen:

Ãîðîä 312 - [Îáåðíèñü (Áîíóñ)] Îáåðíèñü (Rock version)

Komischerweise finde ich "Ãîðîä 312" auch über Google - nur keine Erläuterung zu den selsamen Zeichenketten, die von Vokalen und diakritischen Zeichen wimmeln. Dass es sich um eine Umschrift handeln könnte, glaube ich eher nicht. Braucht man vielleicht einen speziellen Font, damit die zugrundeliegenden kyrillische Zeichen engezeigt werden?

Gruß, stefle
cr
Inventar
#2 erstellt: 26. Okt 2008, 21:22
Falscher Zeichensatz. Gibt ja verschiedene Standards (brauchst nur mal im IE unter Ansicht > Codierung schauen, was es alles gibt).
audiophilanthrop
Inventar
#3 erstellt: 26. Okt 2008, 22:50
Jetzt ist das Kind natürlich schon in den Brunnen gefallen. Ursprünglich war das wohl KOI8-R oder Windows-1251, jetzt werden die Namen im Rahmen des lokalen Systemzeichensatzes (Windows-1252 oder ISO-8859-1) interpretiert.
Ich würde die Namen in eine Textdatei kopieren, diese im Browser mit dem richtigen Zeichensatz anzeigen lassen und dann einzeln die Namen kopieren und unbenennen. Windows und NTFS können schon lange Unicode, richtig kodiert muß es aber sein.


[Beitrag von audiophilanthrop am 26. Okt 2008, 22:51 bearbeitet]
stefle
Stammgast
#4 erstellt: 26. Okt 2008, 23:37
Danke erstmal für den Tip.

Wenn ich die verschiedenen Kodierungsoptionen durchprobiere, komme allerdings nicht zu einem sinnvollen Ergebnis.

Na ja, macht nix.
stefle
Stammgast
#5 erstellt: 26. Okt 2008, 23:42
Hey, das geht ja doch!!!

Danke @audiophilanthrop

Komischerweise ging das erst, als ich eine .txt-Datei mit dem Browser geöffnet habe. Bei ergoogelten Websites mit ähnlichem Salat hat es nicht geklappt - wie ich ja soeben berichtet habe.

Müßte das nicht auch gehen?
audiophilanthrop
Inventar
#6 erstellt: 26. Okt 2008, 23:57
Komisch, hab das mal im Seamonkey als Kyrillisch (1251) dekodieren lassen, und heraus kam dieses, was recht sinnvoll aussieht:

Город 312 - [Обернись (Бонус)] Обернись (Rock version)

Ich hatte allerdings ein Problem übersehen: Wenn die Dateien auch in CP1251 getaggt sind (MP3V2 erlaubt zwar auch Unicode, oft liegen die Tags aber doch im Systemzeichensatz vor), hast du wohl Pech gehabt.

EDIT: OK, das hat sich ja jetzt geklärt.

Komischerweise ging das erst, als ich eine .txt-Datei mit dem Browser geöffnet habe. Bei ergoogelten Websites mit ähnlichem Salat hat es nicht geklappt - wie ich ja soeben berichtet habe.

Müßte das nicht auch gehen?

Das läßt sich leicht erklären, wie z.B. bei last.fm - die Seite verwendet UTF-8-Kodierung, kann also den gesamten Unicode-Zeichenumfang darstellen. Da steht dann auch tatsächlich "Ãîðîä 312" (entsprechend UTF-8-kodiert, was als ISO-8859-1 dekodiert "Ãîðîä 312" ist), die Fehlinterpretation von CP1251 als CP1252 fand schon vorher statt, wie oben erwähnt. Auf last.fm sieht man dann auch eine explizite Empfehlung des MusicBrainz-Taggers, vielleicht löst der auch dein Problem.


[Beitrag von audiophilanthrop am 27. Okt 2008, 00:01 bearbeitet]
cr
Inventar
#7 erstellt: 27. Okt 2008, 00:08
bei der freedb habe ich ähnliche Zeichensätze bisher nur bei einigen wenigen orientalischen und griechischen CDs gehabt.
stefle
Stammgast
#8 erstellt: 27. Okt 2008, 04:00

audiophilanthrop schrieb:
K
Das läßt sich leicht erklären, wie z.B. bei last.fm - die Seite verwendet UTF-8-Kodierung, kann also den gesamten Unicode-Zeichenumfang darstellen. Da steht dann auch tatsächlich "Ãîðîä 312" (entsprechend UTF-8-kodiert, was als ISO-8859-1 dekodiert "Ãîðîä 312" ist), die Fehlinterpretation von CP1251 als CP1252 fand schon vorher statt, wie oben erwähnt. Auf last.fm sieht man dann auch eine explizite Empfehlung des MusicBrainz-Taggers, vielleicht löst der auch dein Problem.


Jap, das leuchtet ein!

Da wundern sich dann wohl einige über die merkwürdigen Zeichen.

Was ich nicht wußte: Wenn ich eine Zeichenfolge als .txt speichere, geht die Unicode-Kodierung verloren. Hab's grad mal mit kyrillischen und chin. Zeichen aus der Arial Unicode probiert.


[Beitrag von stefle am 27. Okt 2008, 04:01 bearbeitet]
cr
Inventar
#9 erstellt: 27. Okt 2008, 04:11

Was ich nicht wußte: Wenn ich eine Zeichenfolge als .txt speichere, geht die Unicode-Kodierung verloren. Hab's grad mal mit kyrillischen und chin. Zeichen aus der Arial Unicode probiert.


Ist aber logo, weil txt nur AINSI-Code (128 Zeichen) bzw. MS_DOS-Txt ASCII-Code (256 Z.) verwendet (beim Öffnen als Word kannst du KONVERTIEREN BESTÄTIGEN vorwählen und wirst dann nach dem Format gefragt (wo man auch zwischen normalem .txt und MS_DOS_txt unterscheidet). Kenne ich daher, weil ich MSDOS_txt-Dateien eines alten Schreibsystems mal konvertieren mißte.
stefle
Stammgast
#10 erstellt: 27. Okt 2008, 04:18
Allerdings ist das hier wohl nicht relevant, denn die Tags in den mp3-Files waren von vornherein keine Unicode-Zeichen (im Gegensatz zu den völlig identischen, aber ander kodierten Zeichen auf der Website). Durch den Speichervorgang ist also nix verloren gegangen.
audiophilanthrop
Inventar
#11 erstellt: 27. Okt 2008, 12:02
Auch bei schnöden Textdateien kommt es letztlich auf den verwendeten Editor an - Informationen zu ihrer Kodierung enthalten sie im Normalfall nicht. Die meisten Windows-Editoren werden per Default im ANSI-Zeichensatz anzeigen, das Windows-Notepad kann (zumindest ab 2000 oder so) auch UTF-16, welches dann am entsprechenden Marker-Byte am Anfang der Datei erkannt wird. Mein Standard-Editor (WinVi) kann noch mehr - ANSI, DOS (hier CP850), UTF-8, UTF-16 (big endian und little endian), sogar EBCDIC, das ganze noch mit zuschaltbarem Hex-Modus.
stefle
Stammgast
#12 erstellt: 27. Okt 2008, 13:49
Danke, wieder was gelernt.

Hab auch Vista (32 b) und versuchsweise mit dem Editor chin. Zeichen gesperichert. Klappt. Im Speichern-Dialog kann ich zwischen AINSI, Unicode, Unicode Big Endian (nur Big) und UTF-8 wählen.

Ansonsten finde ich keine Optionen. Wie kann man denn zum Beispiel eine Datei hexadezimal anzeigen lassen?

Mein erster Versuch, Ãîðîä 312 - [Îáåðíèñü (Áîíóñ)] Îáåðíèñü zu "dechiffrieren" ging auch über den Winsdows-Editor, ohne Erfolg.
stefle
Stammgast
#13 erstellt: 27. Okt 2008, 13:52
Sorry, kleine Missverständnis. Ich dachte WinVi heißt "Windows Vista".
http://www.winvi.de/de/
stefle
Stammgast
#14 erstellt: 27. Okt 2008, 13:57
Nettes Teil, läuft ohne Installation.
stefle
Stammgast
#15 erstellt: 27. Okt 2008, 14:34

audiophilanthrop schrieb:
[...] Windows-Notepad kann (zumindest ab 2000 oder so) auch UTF-16, welches dann am entsprechenden Marker-Byte am Anfang der Datei erkannt wird.


Manchmal fragt mein Textverarbeitungsprogramm nach der Zeichenkodierung, wenn ich eine txt-Datei öffnen will. Ich nehme an, das liegt daran, dass ein entsprechendes Flag fehlt.

Ich würde das Flag bei anderen Dateien gern mal versuchsweise löschen, um so eine Nachfrage zu provozieren. Braucht man dafür einen HexEditor?


[Beitrag von stefle am 27. Okt 2008, 14:35 bearbeitet]
Suche:
Das könnte Dich auch interessieren:
Mehrere Genre bei MP3-Tags
swetrain am 22.01.2020  –  Letzte Antwort am 14.11.2021  –  9 Beiträge
Cover in mp3-Tags einbinden - Welche Größe
technik-bastian am 24.08.2009  –  Letzte Antwort am 17.02.2010  –  11 Beiträge
MP3 Tag - Tags übers Netz abgleichen
Asgard~ am 06.04.2013  –  Letzte Antwort am 06.04.2013  –  4 Beiträge
ID3 Tags bei MP3 automatisch erkennen
MBMBMB am 10.04.2014  –  Letzte Antwort am 13.04.2014  –  11 Beiträge
ID3-Tags verbinden
ratzelino am 22.07.2011  –  Letzte Antwort am 27.07.2011  –  12 Beiträge
Seltsame Dynamikschwankungen
matt69_de am 21.10.2010  –  Letzte Antwort am 09.11.2010  –  23 Beiträge
Tags für FLAC-Files von MP3-Files übernehmen?
HorstMa am 14.08.2008  –  Letzte Antwort am 15.08.2008  –  7 Beiträge
Tool zum Anzeigen aller Details der mp3 Tags (wie Lame)
löw am 29.04.2023  –  Letzte Antwort am 02.05.2023  –  8 Beiträge
Windows Media Player bringt Tags durcheinander
Rotten67 am 08.01.2012  –  Letzte Antwort am 09.01.2012  –  5 Beiträge
FLAC mit ID3-Tags?
sakhmet am 16.10.2005  –  Letzte Antwort am 16.10.2005  –  3 Beiträge
Foren Archiv
2008

Anzeige

Produkte in diesem Thread Widget schließen

Aktuelle Aktion

Partner Widget schließen

  • beyerdynamic Logo
  • DALI Logo
  • SAMSUNG Logo
  • TCL Logo

Forumsstatistik Widget schließen

  • Registrierte Mitglieder925.731 ( Heute: 1 )
  • Neuestes MitgliedTschoker
  • Gesamtzahl an Themen1.551.073
  • Gesamtzahl an Beiträgen21.537.431

Hersteller in diesem Thread Widget schließen