Ich habe auf der Suche nach einer Antwort sowohl hier als auch auf Google gesucht, obwohl ich einige Hinweise gefunden habe, die ich nicht ganz gefunden habe eine Lösung.Beste Datenbankstruktur zum Speichern von RSS-Feeds
Wenn Sie einen einfachen RSS-Reader mit einer Datenbank haben, könnten Sie zum Speichern von Feeds ein paar Tabellen (ohne Berücksichtigung mit Abonnent zu tun hier):
- Feeds (feed-ID, Futtermittel-Titel , feed-url)
- Artikel (Artikel-ID, feed-ID, Artikel-Titel, Artikel-Inhalt)
Dies funktioniert in den meisten Fällen, aber für viele Websites/webbasierte Anwendungen haben Sie möglicherweise einen Haupt-Feed von der Startseite und dann Kategorie-Feeds, wenn Sie beide in die obige Art von System nehmen, wird es eine Menge replizierter Daten aufgrund sein Derselbe Beitrag erscheint in mehreren RSS-Feeds.
Die zwei Möglichkeiten, die ich gefunden habe, sind entweder ignorieren und akzeptieren die Duplikate oder verwenden Sie eine Verknüpfungstabelle zwischen den Feeds und den Elementen. Aber das scheint auch eine ziemliche Verschwendung zu sein, wenn wahrscheinlich 80% der Art von Feeds, die ich zu ziehen versuche, nicht mehrere Feeds haben, die diese Replikation erzeugen könnten.
Gibt es einen besseren Weg dies zu tun/schaue ich das völlig falsch an?
aktualisieren
Dank sowohl für die Antworten, so der Konsens, dass die Einsparung von Raum zu sein scheint wahrscheinlich nicht signifikant genug ist, um sich Sorgen zu machen und würde durch das Potential für unbekannte Probleme negiert werden (wie zum Beispiel von dbr erwähnt).
Das Hinzufügen einer Linktabelle oder ähnlichem würde wahrscheinlich auch die Verarbeitungszeit erhöhen, so dass es sich insgesamt nicht lohnt, sich zu viele Gedanken zu machen. Ich hatte Gedanken nach dem Lesen der Antworten der Verknüpfung von Inhalten und Entfernen von Duplikaten nur dann, wenn der Beitrag nicht mehr in RSS-Feeds ist, um Platz zu sparen, aber wie Assaf gesagt hat, könnte die Platzeinsparung dies eine Zeitverschwendung machen.