|
Was war, was wird...
Nach über einem Jahr Entwicklungszeit ist es soweit: TFSNA2 wird der
(FeM-)Öffentlichkeit vergestellt. TFSNA2 hat mit TFSNA nur eines gemeinsam,
nämlich den Namen. Während TFSNA nur ein Test für diverse Algorithmen war,
steckt hinter TFSNA2 ein durchdachtes, objektorientiertes Datenbankkonzept,
welches es erlaubt, beliebige Informationen in der Datenbank abzuspeichern und
diese schnell zu durchsuchen und abzurufen.
Die momentane Version von TFSNA2 ist noch sehr weit von dem entfernt, was wir
geplant haben, bietet allerdings schon jetzt einige Vorteile gegenüber TFSNA1
für den Benutzer:
-
Sehr zuverlässige Crawler für FTP und SMB. Es sollte nun nahezu jeder Rechner
in der Datenbank erscheinen.
-
Datenbankupdates werden kontinuierlich durchgeführt.
-
Ist ein Rechner online, so wird dieser alle 2-3 Stunden gecrawlt.
-
Überarbeitetes, übersichtlicheres Webinterface.
Durch die neue Architektur wird es uns in den nächsten Monaten möglich sein,
unter Anderem folgende Features in TFSNA2 zu implementieren:
-
Multimediainformationen, wie Abspieldauer, Bitrate, Bild-/Videogröße und Codec
für die verschiedensten Multimediaformate (wav, mp3, ogg, avi, mpg, etc.).
-
Umfangreiche Filter- und Sortiermöglichkeiten.
-
Bessere Unterstützung von Wildcards und Bool’schen Operationen in der
Abfragezeile.
-
Thumbnails für Bilddateien (jpg, gif, bmp, etc.).
-
Durchsuchen von ID3/OGG Tags.
-
Der Höhepunkt soll irgendwann die Möglichkeit zum Durchsuchen von Text-, HTML-,
Word-, PDF- und anderen Textformaten sein.
Da sich TFSNA2 noch in der Entwicklung befindet, sind alle zur Anwendung
kommenden Algorithmen noch nicht optimiert. Über die nächsten Monate werden
Geschwindigkeitssteigerungen um den Faktor zwei bis drei zu erwarten sein.
Hier sind einige technische Fakten zu TFSNA2:
-
TFSNA2 erlangt seine gesamte Funktionalität durch Plugins, die sich über eine
COM-Schnittstelle in das Framework integrieren.
-
Die Plugin-Schnittstelle erlaubt das Crawlen beliebiger Datenquellen (z.Z. FTP
und SMB).
-
Resource-Handler-Plugins sind dafür zuständig, beliebige Informationen über die
gecrawlten Dateien abzufragen und über Information-Handler-Plugins in der
Datenbank zu speichern. Letztere sind außerdem für das Abfragen der Daten aus
der Datenbank zuständig.
-
TFSNA2 arbeitet komplett objektorientiert. Alle Daten werden in Form von
Klassenobjekten in der Datenbank gespeichert.
-
Strings werden intern als Unicode behandelt. Dadurch können auch unsere
chinesischen Server in die Datenbank mit aufgenommen werden.
-
Das Backend (Crawler und Server) ist komplett in C++ geschrieben und umfasst
über 20000 Zeilen.
-
Das Frontend (die Weboberfläche) ist in C# geschrieben.
-
TFSNA2 läuft ab Windows 2000 und wird für Multiprozessorsysteme optimiert
werden.
|