Bugs & Wishes

An intelligent developer said once "A good database is never finished". This also applies to Agentarius. There is always something to work on. Either there is an error somewhere or there is a need to integrate new functions. This page is intended to make Agentarius still better.

 

Discussions (6)





Bold Italic Underlined Strikethrough Code Quote Link
 

  • Anregungen Anregungen

    Claus Meier
    Tuesday, 06.07.2010
    Hallo Kristof,

    bin bei Wikipedia über Deine Seite gestolpert und finde das Projekt total klasse.
    Habe mal meine Log-Files der letzten Jahre durchgefiltert und die User-Agents in die Datenbank eingetragen.

    Dabei ist mir so einiges an Wünschen und Verbesserungen aufgefallen.

    1) Ich denke die Aufteilung in 21 Kategorien und 761 Gruppen sind für den Einsteiger zunächst etwas verwirrend, insbesondere wenn man die unbekannten Agents einordnen möchte.
    Es sollte dabei auch die Möglichkeit bestehen einen User-Agent einer Obergruppe und nicht nur einer der 761 direkten Gruppen zuzuordnen.
    (z.B. der Gruppe "Mensch" oder der Kategorie "Browser")

    Mensch
    - Browser
    - Firfox
    - 1.5
    - 2.0
    - 3.6
    - Internet Expolrer
    - 5.5
    - 6.0
    - 8.0
    - eMail
    - etc

    Maschine
    - Suchmaschinen
    - Download-Manager
    - Validator
    - etc
    - Sonstige Crawler/Spider/Robots

    Unbekannt
    - etc

    Gerade bei den Spider/Crawler/Robots ist eine direkte Gruppenzugehörigkeit häufig sehr schwierig.


    2) Sinnvoll wäre auch eine Routine die den gesamten Datenbestand regelmäßig nach Filter-Wörtern durchsucht und entsprechende Klassifizierungen durchführt. Also nicht nur beim ersten Eintrag. Optimal wäre es dann, wenn man als User die Möglichkeit hätte zu jeder Gruppe entsprechende Einschluss- bzw. Ausschlusswörter festzulegen. So ließe sich ein komplexer Filter aufbauen, der die aufwändige manuelle Einordnung deutlich reduzieren könnte.


    Was ist z.B. der Unterschied zwischen "Suchmaschinen-Software" und "Suchmaschine"


    3) Eine Routine, die die Datenbank regelmäßig nach absolut identischen User-Agents durchsucht.

    Der String "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" ist z. B. 65 mal bzw. der String "Mozilla/5.0 (Windows; U; Windows NT 5.1; de; rv:1.8.1.20) Gecko/20081217 Firefox/2.0.0.20" 9 mal in der Datenbank vorhanden.


    4) Suchmöglichkeit nur innerhalb einer Kategorie/Gruppe.


    5) Eine Möglichkeit die gesamte Datenbank als XML-File downzuloaden.


    Gruß Claus

  • Listen ausgeben Listen ausgeben

    Elias Kirchgässner
    Wednesday, 18.11.2009
    Verschiedene Statistijprogramme nutzen unterschiedliche Erkennungslisten. Die Meisten sind relativ simpel aufgebaut
    useragent Trenner Beschreibung/Internetadresse
    Es wäre schön, wenn man sich solche Listen ausgeben lassen könnte. Oder geht das schon über die API?
    Kristof Zerbe
    Wednesday, 18.11.2009
    Wie nennen sich diese Listen bzw. welches dedizierte Format haben sie? Einen Web-Service daraus zu machen ist absolut kein Problem.
    Elias Kirchgässner
    Wednesday, 18.11.2009
    Bei mir geht es um page Logger. Die Listen sind Textdateien.
    robots.txt
    und searchengines.txt

    Bsp:
    robots (Ausschnitt) InfoSeek#InfoSeek
    Insitor#Insitor
    KazoomBot#KazoomBot
    Knowledge.com#Knowledge
    LWP::Simple#LWP-Bot
    Link Swapper Agent#LinkSwapper
    LinkExplore.com#LinkExplore
    Links SQL#LinksSQL
    Links _0-9'>{1,2}._0-9'>{1,2}#LinksBot
    Linktausch#Linktausch
    MJ12bot#MJ12bot
    Mediapartners-Google#GoogleMedia
    MetaTagRobot#MetaTagRobot
    Metaro-Bot#MetaroBot
    Microsoft URL Control#MS-URL
    NG/#ExaBot


    searchengines

    blitzsuche.rp-online.de
    brisbane.t-online.de
    britannica
    bsearch-dyn.tiscali.de
    bsearch.com
    bytedog
    caloweb
    chercher.lycos
    directhit
    dmoz.org
    dogpile.com
    eniro.se
    excite
    fireball
    freenet.de
    google
    hotbot
    ilsearch
    inktomi
    iwon
    jserv.rrzn.uni-hannover
    links2go
    looksmart
    lotse.de
    Kristof Zerbe
    Thursday, 19.11.2009
    Die beiden Listen sind Spezialitäten von pageLogger zur Erkennung der User-Agents über Regular Expressions. Ich verwende zwar auch RegEx, aber mit einem etwas komplexeren, hierarchischen System, das nicht direkt übertragbar ist. Man müsste für jeden einzelnen UA RegEx-Strings definieren, bevor ein Export Sinn macht.

    Ich habe mal mit dem Hersteller Kontakt aufgenommen. Vielleicht haben die Interesse an der Definition einer Schnittstelle...
    Kristof Zerbe
    Thursday, 19.11.2009
    Ah ok, in der Bestätigungsmail vom Hersteller steht:

    Bezieht sich ihre Anfrage nicht auf ein bereits bestehendes Ticket, werden Sie keine Antwort vom Support erhalten, da die Living-e AG ab dem 01.Juni 2009 keinerlei Dienstleistungen für die Produkte webEdition, pageLogger, timeEdition und MAMP mehr anbietet


    Open-Source ... d.h. ich werde es mal auf der SourceForge-Seite posten.

  • Login und Registrierung Login und Registrierung

    Alex Emken
    Wednesday, 04.02.2009
    Erstmal: Super Service! :)

    Zwei kleine Anmerkungen zur Registrierung und Login:

    Registrierung - >= 4 Zeichen für Username! Das ist natürlich eine Frage über die sich vortrefflich streiten lässt und die im Endeffekt lediglich vom persönlichen Geschmack abhängig ist.

    Login: OpenID. Die Möglichkeit sich mittels OpenID bei einer Website anzumelden findet immer größere Verbreitung. Je höher die Verbreitung, desto höher auch die Aktzeptanz des Modells. Grade so innovative Services wie dieser sollten es unterstützen.
    Kristof Zerbe
    Thursday, 05.02.2009
    OpenID? Ja, Definitiv! Wird es demnächst geben. Ein kleiner Festplattencrash hat mich nur etwas nach hinten geworfen. War fast fertig...

  • Ändern-Knopf auch auf „Start/Blog“ Ändern-Knopf auch auf „Start/Blog“

    Tobias Schlemmer
    Thursday, 30.10.2008
    Ich fände es nett, wenn man auch auf der Startseite einen Ändernknopf für den eigenen Browser installieren könnte. Dazu könnte man auch die Klassifikation (Unbekannt/Automatisch/manuell erkannt) mit anzeigen.

    Den eigenen Browser kann man meist immer noch am besten manuell einordnen.
    Kristof Zerbe
    Sunday, 28.12.2008
    Der Infobereich auf der Startseite wurde renoviert und ein "Bearbeiten"-Link hinzugefügt.

  • Suchfunktion Suchfunktion

    Tobias Schlemmer
    Thursday, 30.10.2008
    Ich vermisse irgendwie eine funktionierende Suchfunktion für Agent-Strings. In der API klappts, aber im Web-Frontend nicht so toll.
    Jedenfalls liefert das Suchformular mir nur 404 Not Found.
    Kristof Zerbe
    Sunday, 28.12.2008
    Zwei kleine Fehler bei der Suche habe ich nun ausgemerzt. Sollte wieder funktionieren.

  • Erkennung des Betriebsystem Erkennung des Betriebsystem

    Johann Schmitz
    Sunday, 13.04.2008
    Wie siehts mit einer Erkennung des Betriebsystems aus dem UA aus? Die meisten liefern ja schon genug Informationen mit, so das man zumindest eine grobe Klassifizierung nach Windows, Linux, Mac vornehmen kann. Im XML-Format habe ich einen Node unterhalb der Group im Sinne.

    Das würde die generierten Graphen noch schöner machen ;)
    Kristof Zerbe
    Wednesday, 30.04.2008
    Die Frage ist, ob Agentarius da weiterhelfen kann oder sollte, denn der Dienst ist zunächst einmal da, um User-Agents zu klassifizieren. Die Interpretation einzelner Teile, wie dem OS ist sicherlich möglich, würde aber auch nur auf Standard-Funktionen der jeweiligen Script-Sprache (PHP, ASP.NET, et cetera) zurückgreifen, die der Entwickler einer Seite eh schon hat.