5. Februar 2012  
  Suche:
 
  Basics
  Code-Galerie
  Forum
  FAQ
  Tipps & Tricks
  Literatur
  Knowledge Base
  Workshops
  JSP-Hosting
  JSP-Engines
  Jobbörse
  Links
  JSP-Sites
  Newsletter
  JSP-Test
  Impressum
  Username:
  
  Passwort:
  
  

  Jetzt registrieren
  Warum registrieren?

  Valid HTML 4.01!
  Valid CSS!

Volltextsuche optimieren..

von DocMcFly,  22.07.2005 10:27:20  (1 vote) Kommentare (1)  [vote]
Wenn noch jemand das in Java ausprogrammiert hat (mit einem schnellen Algorithmus) - dann könnte man vielleicht diesen Beitrag vom Pseudo-Code befreien.

Aufgabe ist es die Volltextsuche (Suche nach einzelnen Wörten nicht nach Phrasen!) zu optimieren bzw. den Speicherplatz zu minimieren.

Wenn ein Text durch sucht werden soll könnte man alle doppelten Wörter entfernen und alles was kürzer als zwei Zeichen.

Dazu verwende ich den CodeSchnipsel "string2array..." und entferne die doppelten Feldeinträge und die Worte die kleiner sind als Zweizeichen.

Jetzt kann ich das Feld entweder so speichern, und habe eine Art Index für den Text. Ich kann das Feld auch in eine DB übertragen. (als String oder eigene Tabelle). Die Platzersparnis ist teilweise erstaunlich. Im Schnitt fallen bei nochmalen Texten ein Drittel bis die Hälfte weg.

String Volltext = "ganz langer Text ...";

String[] array = explode(" ", Volltext);

for(int j=0; j<array.length(); j++){
  // kurze Worte killen
  if(array[j].length < 3 ) array[j] = null;
 
  if(array[j]!= null)

    // doppelte Einträge rausschmeissen
    for(int i=0; i<array.length(); i++)
      if(array[j].equal(array[i]))
        array[i] = null; 
}



<< zurück


Hinweis: Auf dieser Seite liegen Links zu anderen Seiten im Internet. Für alle diese Links gilt: Wir betonen ausdrücklich, daß wir keinerlei Einfluß auf die Gestaltung und die Inhalte der gelinkten Seiten haben. Deshalb distanzieren wir uns hiermit ausdrücklich von allen Inhalten aller gelinkten Seiten auf dieser Homepage und machen uns ihre Inhalte nicht zueigen. Diese Erklärung gilt für alle auf unserer Homepage angebrachten Links

Redaktion/Betreiber von JSP-Develop übernehmen keinerlei Gewährleistung und Verantwortung für die Richtig- und/oder Vollständigkeit von den auf den Webseiten JSP-Develop veröffentlichten Source Codes. Die Verantwortung der Verwendung/Anwendung sowie etwaige Modifikation der hier veröffentlichten Sourcen obliegt einzig dem Benutzer der Webseite, welche die veröffentlichten Sourcen in einer Applikation/Anwendung einsetzt. Durch das Kopieren und/oder Benutzen der Sourcen in einer Applikation/Anwendung bzw. etwaigen Abschriften wird dieser Rechtshinweis anerkannt.

Java, JSP, JavaServer Pages, J2EE, EJB, JDBC, JNDI, JTA, Sun, Sun Microsystems are trademarks or registered trademarks of Sun Microsystems, Inc. in the United States and in other countries. IBM, WebSphere are trademarks or registered trademarks of International Business Machines Corporation. Other trademarks and registered trademarks are the property of their respective owners.