Freie Suchmaschine: YaCy 1.0

YaCy logo

Ohne Suche geht im Web gar nichts. Die Hälfte der zehn meistbesuchten Websites bietet vor allem Websuche an. Suchmaschinen sind unser Zugang zur der Informationsfülle im Netz. Sie entscheiden, was wir zu sehen bekommen, und was nicht. Sie funktionieren als Filter.

Deshalb ist die Frage so wichtig, wer diese Filter kontrolliert. Dabei geht es nicht so sehr darum, ob wir den Suchmaschinen vertrauen, die wir heute nutzen. Sondern darum, ob wir uns für alle Zukunft auf sie verlassen wollen.

Gerade das mach YaCy so interessant.

YaCy logoYaCy ist eine Suchmaschinensoftware die sich jeder installieren kann um damit ein Suchportal zu errichten, das Intranet zu indexieren oder andere Daten mit einer Suchfunktion zu erweitern. YaCy kann als Einzelinstallation betrieben werden aber die besondere Fähigkeit der Software ist die Vernetzung in einem Peer-to-Peer Suchmaschinennetz. Ein solches Suchmaschinennetz skaliert mit der Anzahl der Nutzer, ist vollständig dezentral (alle Peers sind gleichberechtigt und es gibt keine zentrale Verwaltungsinstanz) und ist damit nicht zensierbar und speichert auch kein Nutzerverhalten an zentraler Stelle. Das Erreichen von Informationsfreiheit durch freie, dezentrale Suchsoftware ist auch ein Projektziel.

Heute hat YaCy die Version 1.0 seiner Software veröffentlicht. Das ist ein guter Grund, selbst Teil des Netzwerks zu werden und sich das Programm zu installieren. YaCy gibt es für GNU/Linux, Mac und Windows. Zum Ausprobieren hat YaCy auch ein Suchportal im Netz, auch wenn das nicht die typische Funktionsweise ist.

YaCy bringt seinen eigenen Crawler mit. Je mehr Leute mitmachen, desto besser werden die Ergebnisse für alle. Die Benutzung ist einfach. Wie die Techik dahinter funktioniert, erfahrt ihr hier.

 

 

 

29 Ergänzungen

  1. – Jeder, der seinen Yacy-Knoten voll ins Netzwerk integrieren will, muss einen Port freigeben. Durch diese Portfreigabe ist auch die Websuche des Yacy-Knotens frei zugänglich. Webseiten müssen aber ein Impressum haben. Dadurch wird es Angreifern ermöglicht, meine IP zu meinem Realnamen zu verbinden.
    – Das Nutzerverhalten könnte von einem bösartigen Knoten geloggt werden
    – Yacy zensiert. Und zwar hartkodiert im Quellcode, afaik. (bereits zur „crawling-time“)

    1. – Wenn du deinen YaCy-Knoten kommerziell betreiben wolltest, hättest du mit dem Impressum Recht (private nicht-kommerzielle Seiten benötigen kein Impressum). Das wäre aber so ziemlich entgegen der Idee des Systems.

      – Dann müsste der bösartige Knoten aber zusätzlich die Suchanfragen „enthashen“ – lohnenswert? Interessanter ist da meiner Meinung nach eher die Vebreitung von Spam

      – Quelle für Zensur? Hab‘ auf die Schnelle nichts gefunden.

      1. – Geschäftsmäßige Webseiten unterliegen der Impressumspflicht. Dazu gehören auch kleine Hobby-Homepages. Die Meinungen dazu sind aber durchaus nicht Einheitlich.

        – Bösartige Knoten können gezielt interessante Suchanfragen vorher hashen, um sie später gleich finden zu können. Außerdem stelle ich mir das Enthashen mit bereits existierenden Wörterbüchern nicht schwierig vor. Aber gut, yacy ist kein Anonymisierungsprogramm, deshalb will ich da mal nicht so streng sein!

        – Yacy zensiert. Die Quelle kann ich evtl. heute Abend nachliefern, sobald ich Zuhause bin und anständige Suchmaschinen habe.

      2. Yacy zensiert! Hier die Quelle:

        „Das Indexieren von Tor- oder Freenetseiten wird bewusst zum Teil im Sourcecode verhindert, da es im jetzigen Stadium der Entwicklung von YaCy nicht erwünscht ist derartige Seiten zu indexieren. Es ist jedoch geplant zukünftig das Crawlen solcher Seiten zu ermöglichen, allerdings werden dann vermutlich die Crawl-Ergebnisse nicht global verteilt, sondern stehen nur dem jeweiligen Peer zur Verfügung.“

        Link: http://www.yacy-websuche.de/wiki/index.php/De:FAQ#Wie_kann_ich_Tor-_oder_Freenetseiten_indexieren.3F

        Ähm nein, wir zensieren doch nicht… Wir tun nur „bewusst zum Teil“ verhindern…

      3. Dir ist klar, dass man Freenet und Tor Seiten nicht einfach so aufrufen kann? Die müssten dann schon verlangen, dass jeder Knotenbetreiber Freenet und Tor auf seinem Rechner installiert, was natürlich nicht geht.
        Außerdem steht da, dass es geplant ist.

      4. Es ist mir egal, was geplant ist. Der FAQ-Eintrag steht da schon eine halbe Ewigkeit. Das Crawling hätte im nicht-globalen Modus gar nicht erst eingeschränkt werden dürfen. Das ist einfach ein no-go! Nicht jeder kann den Quellcode selbständig ändern!

    2. Naja, das klingt aber doch ganz schön nach Abtörn und allgemein mit dem ganzen instalieren usw. nee, ohne mich, ansehen tue ich mir den kram jetzt trotzdem mal, auch wenn ich ehrlich gesagt nicht soviel davon erwarte…………

      1. Ohne Software zu installieren, funktionieren die wenigsten dezentrale Programme! Das lässt sich momentan nicht ändern…

  2. Mal sehen wie lange es dauert, bis so ein Schwachkopf das beim LG Hamburg verbieten lässt. … Da man keine Kontrolle über die Indexierung hat, wird man auch verbotenes Indizieren … eine Fundgrube für Abmahner und Störhaftung …

    Die Idee dahinter ist grandios, aber wie alles was sich nicht kontrollieren lässt, wird das auch Gegner in der Politik und Wirtschaft haben.

  3. Schade, das hört sich nach einer echt guten Sache an und dann läufts mit JRE / Java. Auch wenn ich die Suchmaschine gerne unterstützen würde, JAVA kommt mir nicht auf die Kiste, sorry. Reicht schon das ich einmal im Jahr für Elster den Rotz aufn MAC machen muss;-)

    1. Gegen den „Elster Rotz“ gibt es aber noch die guten alten analogen Medien. Aber sobald es an die Bequemlichkeit geht, werden Ideale ganz schnell über Bord geworfen. Typischer MAC-User halt …

      (Nichts für Ungut, musste für das Java-Bashing einfach sein ;) )

      1. Wohl aber auch nicht mehr lange. Abgesehen davon arbeite ich mit dem PC, der Mac ist nur zum spass, für mehr taugt er halt leider nicht und da laufen nur Programme zum testen drauf, was dort funzt darf evtl. irgendwann mal auf den PC;-) Und leider macht Java den PC unheimlich anfällig für Probleme und zudem langsam. Vermeide es daher wo es geht. Wenn man zudem nur DSL-light hat, überlegt man sich zweimal ob man für die installation eines 20mb Progis eine 500 mb schwere Laufzeitumgebung runterladen muss.

    2. Phython, Pearl, Php kommt dir auch nicht auf die Kiste? Wer nur auf binaries steht, darf sich nicht beschweren das Elster auf Linux nicht läuft. Wäre es nämlich ordentlich in Java geschrieben gäbs keine Probleme.

      Sry das musste jetzt einfach sein.

      1. Es gibt eine Java-Alternative: Lisp.
        Das meiste bekommste sogar mit dem Emacs und seinem (nun wirklich für jedermann überblickbaren) Elisp hin.
        Und der Emacs läuft auf jeder Möhre . . .
        Java? No-go und: Überflüssig. Modeerscheinung. Nur was für große Firmen mit einheitlichen Programmier-Standards. Schon vom Konzept her nichts für Freie. Propagandakind. Strategisch eingesetzte Bremsflüssigkeit gegen Entwicklungsgeschwindigkeit, trojanisches Pferd: Man preist lauthals Java – und entwickelt selber heimlich in Lisp – drei bis fünfmal schneller! Java?? Nöö. Punkt.

        Aber:

        Warum krauten wir alle so „jeder für sich“ herum?
        Wäre es nicht an der Zeit, eine Projekt (wie das GNU-Projekt(!), oder – wenn’s denn rechtlich nicht anders geht – eine Genossenschaft zu gründen und das Suchmaschinenproblem weltweit(!) gemeinsam, solidarisch und organisiert anzugehen? Mit GNU/Linux hat es doch auch funktioniert und Projekte wie Apache, Gimp usw. beweisen es doch ebenfalls, daß es funktioniert:

        Ein genossenschaftlicher Projektkern, der als Koordinator, Anlaufpunkt und ggf. juristische Verteidigungsburg dient und drumherum das weltweite Heer freier Programmierer, die sich koordiniert(!) zusammentun, um eine weltweit freie und transparent-nachprüfbar zensurfreie Suchmaschine zu entwerfen und zu entwickeln und ins Netz zu stellen? Und wenn die bisherigen Provider sich da querlegen – der dann eben auch noch als eigener, genossenschaftlicher Provider auftritt – zum Selbstkostenpreis – gemeinnützig!

        Möglicherweise ist allerdings aufgrund der unfreien, von lückenloser Bespitzelung und behördlicher Manipulation gekennzeichneten Gesetzeslage dafür der Standort Deutschland, oder die Region der EU denkbar ungeeignet – aber das sollte doch unter Freien auf internationalem Parkett ein lösbares Problem sein, z.b. durch verteilte Standorte und die sich daraus ergebenden rechtlichen Überschneidungen, deren Widersprüchlichkeit und Interessenchaos unter den Gesetzgebern ja auch durchaus als Faktor für die Verteidigung von Freiheit juristisch genutzt werden kann.

        Rudi

  4. was bringt es mir eine solch tolle technik mit meinem server zu unterstützen, wenn ich davon ausgehen muss, das man wie bei dem betrieb von tor knoten, immer wieder ziel der behörden willkür ist. für eine privatmenschen … also nicht wohlhabenden! ist es schier existenzbedrohend, wenn die gestapo bei einem vor der türe steht und einem seine habe entwendet bzw. gleich den ganzen ruf im sozialen umfeld in den dreck zieht, wegen meist haltlosen anschuldigungen.

    was nützt mir diese technik, wenn sie die unterstützer nicht schützten kann? richtig, nichts! eine feldstudie zum thema: „nette id!“ in die schulblade damit. solche dienste machen erst dann sinn, wenn es einen wandel im politischen und gesellschaftlichen raum gegeben hat. weg von dem: „alle bürger sind potenzielle gefährder!“ hin zu einem normalen bild des bürgers.

    1. Bei tor bekommt man solche Probleme aber nur, wenn man seinen Server als Exit-Node betriebt. Das Relays oder Bridges schon mal angegangen wurde, hab ich bis jetzt noch nicht mitbekommen.

  5. Also auf meine Suchen kam nur Schrott oder gar kein Ergebnis zurück.
    Ist ja nett gedacht, aber so wie das im Moment aussieht ists leider ziemlich nutzlos.

  6. Sehr schön. Und jetzt mault mal nicht alle so rum. Irgendwie so (_wir helfen _uns beim Suchen) wird das doch auf Dauer laufen müssen, oder?
    Und nur weil hier beim CB-Funk noch nicht die gleiche Musi wie im Dudelfunk läuft, ist es doch kein Grund gleich die Flinte ins Schrott zu werfen. YaCy anwerfen, guten Content abgrasen (=Crawler anwerfen) und zusehen, wie wir unser eigenes besseres Radio machen.

Dieser Artikel ist älter als ein Jahr, daher sind die Ergänzungen geschlossen.