Zeichensätze und -kodierung – Anwendungsentwickler-Podcast #32

Dieser Beitrag ist Teil 1 von 14 in der Serie Lernzielkontrollen.

In der zweiunddreißigsten Episode des Anwendungsentwickler-Podcasts gehe ich einige Fragen aus meiner Lernzielkontrolle zum Thema Zeichensätze und -kodierung durch.

Probeabo bei Audible (Affiliate)

Inhalt

  • Zeichensatz vs. Zeichencodierung
  • ASCII: 7 Bit, lateinische Buchstaben, Zahlen usw.
  • Wichtige Sonderzeichen: Line Feed (\n, Position 10), Carriage Return (\r, Position 13)
    • Windows-Zeilenumbrüche: \r\n, Linux: \n
  • zusätzliches Bit -> ISO 8859
  • ANSI vs. ASCII
  • Unicode vs. UTF-8
  • Häufige Fehler
    • Sonderzeichen werden als Fragezeichen dargestellt: Text ist in ISO 8859 codiert, wird aber als UTF-8 interpretiert
    • Sonderzeichen werden als zwei andere Zeichen dargestellt: Text ist in UTF-8 codiert, wird aber als ISO 8859 interpretiert

Literaturempfehlungen

Links

Navigation der SerieHTML – Anwendungsentwickler-Podcast #33 >>
Polyglot Clean Code Developer
About the Author
Ausbildungsleiter für Fachinformatiker Anwendungsentwicklung und Systemintegration, IHK-Prüfer und Hochschuldozent für Programmierung und Software-Engineering.

2 comments on “Zeichensätze und -kodierung – Anwendungsentwickler-Podcast #32

  1. Computerlinguist sagt:

    Bei dem Thema fehlt der Link auf die offizielle Unicode-Seite.
    Ist es zu aufwendig, vor dem Podcast mal schnell in BabelMap oder online nachzuschauen, welches Zeichen welchem Codepoint enspricht? (200: Dezimal È, Hexadezimal Ȁ; ü: Dezimal 252, Hexadezimal 00FC, Ü: Dezimal 220, Hexadezimal 00FC) Das Fragezeichen steht für Zeichen, die nicht im Zeichensatz vorhanden sind oder nicht druckbar sind (z. B. die Control-Zeichen am Anfang von ASCII). Das 2. Byte wird auch als Codepunkt interpretiert, genauso wie das erste, wenn das Programm die 2-Byte-Kodierung nicht erkennt.

  2. Stefan Macke sagt:

    Danke für die Ergänzungen!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

To create code blocks or other preformatted text, indent by four spaces:

    This will be displayed in a monospaced font. The first four 
    spaces will be stripped off, but all other whitespace
    will be preserved.
    
    Markdown is turned off in code blocks:
     [This is not a link](http://example.com)

To create not a block, but an inline code span, use backticks:

Here is some inline `code`.

For more help see http://daringfireball.net/projects/markdown/syntax