SDW Software

SDW Software - HomeSiteSearch 1.1

© 2000 -2005 SDW Software

Download | Demo

für Windows & Unix

SiteSearch 1.1 ist eine Suchmaschine für kleinere bis mittlere Websites. Das Programm ist in Perl geschrieben und läuft unter Windows und Unix ohne spezielle Anpassungen vornehmen zu müssen. Einzig die Pfade und die Schalter sind zu Konfigurieren.  
SiteSearch 1.1 besteht aus den Dateien:
- sitesearch.pl oder sitesearch.plx - das Programm
- sitesearch.htm - das Formular
- sitesearch.css - Formatierungen für die HTML-Seiten

Die im ZipFile vorhandenen Dateien sitesearch.pl und sitesearch.plx sind im Programm genau gleich. Sie unterscheiden sich lediglich in der Art der Pfadangabe auf dem Server. 
Dieses Programm ist Freeware! Wenn Ihr es benutzt und es gefällt Euch, dann schickt mir doch ein Mail mit der Url wo es läuft. Und lasst doch einen Urhebervermerk drin stehen. Vorschläge und Spenden sind auch willkommen :)

Features:
Das Eingabe-Interface erlaubt eine Volltext-Suche über die ganze oder in einem selbst definierbaren Teilbereich einer Website. Per Einstellungen im Kopf des Programmquelltextes lassen sich die unten aufgelisteten Optionen einstellen. Die Optionenfelder in der Formularseite können auch weggelassen werden. Es ist dazu lediglich folgendes im Formular einzutragen  <input type="hidden" name="suchbegr" value="vollsuche">. Als Value kann auch der Name eines einzelnen Ordners stehen der durchsucht werden soll.

Windows:
Damit die Suchmaschine optimal läuft, wird für Windows die Perl-Distribution von ActiveState benötigt <www.activestate.com>, welche unter anderem auch die Perl-DLL 'perliis.dll' enthält. Die Dateiendung für die Suchmaschine ist *.plx und muss, wenn nicht schon geschehen als Filehandler auf dem Server eingerichtet werden. Dies lässt sich in der Managementkonsole unter "Website -> Eigenschaften -> Basisverzeichnis -> Konfiguration" einstellen. Es wird nicht empfohlen das Programm mit der 'perl.exe' laufen zu lassen (Dateiendung *.pl auf Windows)! 
Unter Windows läuft das Script in jedem Verzeichnis mit Ausführungsberechtigung. Die beiden anderen Dateien müssen mindestens lesbar sein.

Unix :
Für Unix ist die Dateiendung des Scripts auf *.pl oder *.cgi zu ändern und ins cgi-bin zu legen und mit "chmod 755" ausführbar zu machen. Die beiden anderen Dateien müssen mindestens "chmod 644" sein und können irgendwo in der Website sein. Der Pfad ist entsprechend zu ändern.

Einen Teilbereich durchsuchen:
Um einen Teilbereich der Website durchsuchen zu können, geben Sie im Optionenfeld auf der Formularseite die Bezeichnung für den Teilbereich z. Bsp. "Fotolabor durchsuchen" und den Wert "fotolabor" für den Namen des Ordners der durchsucht werden soll. Der Name des Optionenfeldes ist immer 'suchbegr' und sollte nicht geändert werden. Die Unterscheidung in Teilbereiche wird mit der Ordnerstruktur auf der Website festgelegt. Es kann nur ein Ordner mit allen darin enthaltenen Unterverzeichnissen als Teilbereich durchsucht werden. Geben Sie in der Konfiguration weiter unten die Bezeichnung (so wie sie im Optionenfeld erscheint) und den dazugehörigen Ordnernamen an. Für einzelne Seiten die nicht durchsucht werden sollen, reicht es als erste Zeile den HTML-Kommentar 
<!-- Dokument nicht durchsuchen --> reinzuschreiben. (Achten Sie auf die Leerzeichen)

Und Oder?
Die Suchabfrage lässt sich variieren. Generell wird nach genau den Begriffen gesucht, so wie Sie sie eingeben. Geben Sie "historische aufzeichnungen" ein so wird genau nach dem Vorkommen von "historische aufzeichnungen" gesucht. Möchten Sie nach beiden Wörtern suchen so geben Sie "historische OR aufzeichnungen" ein. Im Suchergebnis erscheinen die Treffer der Wörter "historische" und "aufzeichnungen". Die Gross- und Kleinschreibung spielt generell keine Rolle. Weitere Verfeinerungen sind in kommenden Versionen geplant.

Anpassen der Pfade:
Unter Windows sehen Pfade so aus:
H:\\www\\webserver\\kunde\\cgi-bin\\sitesearch.plx
Unter Unix so:
/www/webserver/kunde/cgi-bin/sitesearch.pl
Achten Sie auf die beiden Backslashes im Windowspfad.
Die Pfade in der Datei sitesearch.htm müssen auch angepasst werden. Verwenden Sie immer absolute Pfadnamen, da das Formular zuerst vom Programm gelesen wird und dann die Scriptadresse als Location erhält. Passen Sie die CSS-Datei sitesearch.css nach Ihren Bedürfnissen an.

Anpassen der Templatedatei
Das Programm benötigt zur Ausgabe eine vorbereitete Datei. Dazu Verwenden Sie sitesearch.htm oder eine andere Datei. Sie benötigen aber die Zeile "<!-- Hier Suchergebnis einfuegen -->" Dorthin wird das Suchergebnis in Form einer Tabelle geschrieben. Die Zeile lässt sich auch in eine bestehende Tabelle einfügen. Achten sie aber darauf, dass die Zeile keinen Zeilenumbruch enthält. Sie können die Seite Ihren Wünschen entsprechend anpassen. Wenn Sie CSS oder JavaScripts von extern einbinden wollen, geben sie den absoluten Pfad an. 
Das Suchfeld kann, wie oben dargestellt, überall auch in anderen Seiten benutzt werden, als Ergebnisseite fungiert dann die erstellte Datei oder sitesearch.htm  

Optionen zur Konfiguration:

$os = "win";
Einstellen des Betriebssystems.  "win" für Windows und "unix" für die UNixen.

$html_codiert = 1;
Umlaute in der Website sind codiert. Falsch codierte Seiten können das Suchergebnis negativ beeinflussen.
1=ja (bsp. - &auml;) oder nicht 0=nein (bsp. - ä). 

$show_infos = 1;
Sollen zusätzliche Informationen zur Suche angezeigt werden (Datum, Anzahl Dokumente, Suchzeit etc.) Wenn $show_infos auf 0 steht wird nichts angezeigt.
Beispiel = 1:
"Es wurden 16 Dokumente in weniger als 1 Sekunde durchsucht.
 9 Dokumente enthielten mindestens einen Treffer

Das Ergebnis der Suche nach film im Bereich Foto:"
1=ja 0=nein

$show_description = 1;
Soll die Meta-Tag description als Beschreibung der gefundenen HTML-Seite auf der Ergebnisseite angezeigt werden? 
1=ja 0=nein

$show_keywords = 1;
Sollen die Schlüsselwörter des Meta-Tags 'keywords' auf der Ergebnisseite angezeigt werden? 
1=ja 0=nein

$show_treffer = 1;
Soll die Anzahl der Treffer auf der Ergebnisseite angezeigt werden? 
1=ja 0=nein

$show_numero = 1;
Sollen die aufgelisteten Titel nummeriert werden?  
1=ja 0=nein

$htmlform = "H:\\InetPub\\Nts\\Wwwroot\\fujifilm\\suche\\sitesearch.html";
Pfad zum Html Suchformular Template  (\\) Doppelbackslash für Win32 (/) Slash für UNixen.

$such_pfad = "H:\\InetPub\\Nts\\Wwwroot\\fujifilm";
Pfad zur Documentroot der Website.  (\\) Doppelbackslash für Win32 (/) für UNixen

$hosturl = "http://ntsrv/fujifilm";
Url der Website von wo aus gesucht wird. Mit Protokoll.

$scripturl = "http://ntsrv/fujifilm/cgi-bin/sitesearch.pl";
Name dieses Scripts.

@exklusiv = ("_vti_","images","_private","cgi-bin","fr","test");
Von der Suche ausgeschlossene Verzeichnisse. Auch für Unterverzeichnisse nur den Ordnernamen und nicht den ganzen Pfad angeben. ("_vti_"  und "_private" ist zum Filtern vom Microsofts Frontpage Erweiterungen)
Die Themen werden angezeigt wenn $show_info auf 1 steht.

@optionen{"vollsuche"} = ("ganze Website");
@optionen{"foto"} = ("Foto");
@optionen{"industrial"} = ("Industrial");
@optionen{"medical"} = ("Medical");
@optionen{"color_labor"} = ("Color Labor");
@optionen{"fujifilm_ch"} = ("FUJIFILM Schweiz");
@optionen{"news"} = ("News");
Übergabewerte (Ordnernamen) und Namen (Angezeigt) des Select-Optionenfeldes im Suchformular ($htmlform).

 

SDW Software • Internet and Desktop Applications
Gattikonerstrasse 7a • 8136 Gattikon • Switzerland
kem@sitedesign.chwww.sitedesign.ch