2016-12-28 1 views
0

Dies ist meine erste Post auf Stackoverflow. Ich habe mich kürzlich dem Kurs über Data Sciences auf Coursera angeschlossen. Als Student auf Coursera musste ich einige Aufgaben markieren, die eine Frage zum Abschlag beinhalteten. Die Aufgabe forderte alle auf, eine Textdatei zu erstellen, die in einem Repo auf GitHub eingesehen werden konnte. Die Datei musste als sekundäre Überschrift (##) formatiert werden, die folgenden Inhalt hatte: "Dies ist eine Markdown-Datei". Bei den meisten Dateien wurde folgendes angezeigt: 2 Zeilen, 27 Bytes.GitHub - Markdown-Sprache in Textdatei - Anzahl der Zeilen

Aber auf 2 Zuweisungen sah ich das Folgende: '1 Zeile, n Bytes' (n ist verschiedene Bytes). Ich verstehe, dass sich die Bytes geändert haben, weil nicht jeder "Dies ist eine Abreißdatei" geschrieben hat - jemand hat das "a" weggelassen usw. Aber warum sollte sich die Anzahl der Zeilen ändern? Ich überprüfte die Rohdatendatei und alle enthielten dieselben. Ich bin ziemlich neu auf dem Gebiet der Datenwissenschaft (Old School Statistik Hintergrund), also, wenn es eine einfache Antwort ist, entschuldige mich bitte für die Frage.

+0

Könnten Sie bitte einen Link zu einer solchen Datei auf GitHub teilen? – Mureinik

+0

könnte es Zeilenenden sein, versuchen Sie 'dos2unix'. Versuchen Sie auch, die Datei erneut von Grund auf neu zu erstellen. –

+0

@mureinik Hallo Mureinik, ich kann nur meinen eigenen Github-Link liefern, um Ihnen zu zeigen, was ich meine. Dies ist [github link] (https://github.com/Louis-York/datasciencecourse/blob/master/HelloWorld.md). Auf dieser Seite können Sie sehen, dass meine Datei.md 2 Zeilen hat. Dies war, was ich auf jeder Seite sah, außer für 2 Personen, wo es eine Datei mit einer Zeile zeigte. –

Antwort

0

Das hat fast sicher mit Zeilenenden zu tun.

Die meisten Leute haben wahrscheinlich eine Zeile am Ende der ersten Zeile eingeschlossen. Daher enthält die Datei eine zweite leere Zeile. Einige Benutzer haben keine Zeilenendung hinzugefügt (mit dem Schlüssel [enter] oder [return]). Daher enthält ihre Datei eine Zeile.

Im Allgemeinen wird es als gute Form angesehen, eine Zeile am Ende der letzten Zeile einer Textdatei einzufügen. In der Tat werden viele Texteditoren automatisch eine für Sie hinzufügen, weshalb wahrscheinlich die meisten Dateien zwei Zeilen enthalten. Das heißt, jeder ordentliche Markdown-Parser sollte in der Lage sein, eine Markdown-Datei korrekt zu analysieren, wobei eine Zeilenendung in der letzten Zeile fehlt.

Der Unterschied in der Dateigröße (wenn es keine Tippfehler gibt), ist wahrscheinlich auch auf Zeilenenden zurückzuführen. Unter Windows (DOS) verwendet der Systemstandard zwei (verborgene) Zeichen, um eine Zeilenendung darzustellen (normalerweise dargestellt als \r\n). Während alle anderen Systeme (Mac OS, Linux, Unix usw.) nur ein einzelnes Zeichen verwenden (\n). Auch hier sollte jeder anständige Markdown-Parser mit beiden umgehen können. Aber, jeder gibt eine andere Anzahl von Zeichen und daher eine andere Dateigröße.

+0

Vielen Dank Waylan, das macht Sinn. –

Verwandte Themen