Auf den ersten Blick hat sich mit unserer neuen Suche nichts geändert. Das ist der Blick bevor man eine Suchabfrage abschickt. Die Treffer sind von erheblich besserer Qualität (so aus rein subjektiver Sicht der Dinge). Die Suche erfolgt jetzt nach allen Suchbegriffen. Wenn man vorher mehr als einen Begriff eingegeben hat, z.B. Videopodcast Berlin wurde sowohl nach Videopodcast als auch nach Berlin gesucht. Jetzt wird eine sog. Boolsche Suche durchgeführt, wo immer nach allen Begriffen gesucht wird. Wenn Sie weiterhin gleichzeitig nach mehreren Begriffen suchen möchten, schreiben Sie einfach ein OR zwischen die Begriffe, z.B. Berlin OR Hamburg , um wie in diesem Fall Treffer zu Berlin oder Hamburg geliefert zu bekommen.
Weitere Neuerungen sind die Möglichkeit Begriffe mit 2 Buchstaben, wie Ei oder B5 zu suchen, Benutzer nach Geschlecht zu filtern, z.B. alle Benutzerinnen aus Berlin oder alle Männer aus Stuttgart .
In die Suchergebnisse fließen jetzt auch die vergebenen Stichwörter bei Podcasts und Episoden und bei Podcast zusätzlich die Kategorien ein, so daß Inhalte nicht mehr nur über die Beschreibungen auffindbar sind.
Die neue Suche steht sowohl über die Podcast-Suche im Portal (mit Suchmöglichkeit für Podcasts, Episoden, Benutzer und FAQ) als auch über unsere spezielle Suchschnittelle zur Verfügung.
Theoretisch wird jetzt auch die Suche nach Podcasts mit einer Mindestbewertung, aus einem bestimmten Zeitraum und zu allen anderen verfügbaren Daten möglich. Darauf müssen Sie aber noch etwas warten.
Für alle Technikinteressierten noch ein paar Details zur neuen Enterprise Class Suche von podcast.de. Vorher sind die Suchanfragen über den MySQL Volltextindex abgewickelt worden. Das hat bei einem Datenbank-basierten System den Vorteil, dass Änderungen am Datenbestand sich sofort in den Suchergebnissen wiederfinden (mal abgesehen von zwischengeschalteten Caches). Jetzt sind wir auf Lucene, bzw. Solr umgestiegen. Dort werden die Daten noch einmal separat indiziert. Solr stellt eine Schnittstelle über HTTP zur Verfügung, die wir von unserem Applikations-Backend aus ansprechen. Die Suchanfragen sind verglichen mit vorher blitzschnell. Das liegt zum einem daran, dass die Suche auf einen neuen Server ausgelagert wurde. Zum anderen ist die Geschwindigkeit im Gegensatz zu vorher auch nicht mehr abhängig von der Anzahl der Treffer. Im Moment kommt die Geschwindigkeit noch nicht ganz beim Benutzer an, da der Applikationsserver nach wie vor / mal wieder überlastet ist. Ich arbeite dran…
Wer eine Alternative zur MySQL-Volltextsuche sucht, dem kann ich Solr nur empfehlen!
Wir freuen uns wie immer über Feedback. Entweder hier im Blog in den Kommentaren oder im Feedback-Forum auf podcast.de!
Links: