アクセスカウンターアクセスカウンターアクセスカウンター








簡単なNamazu設置と2.0.21へのバージョンアップ法(windows版)

ホームページ作成・保存画面からローカルディスクへのホルダーのコピペ、インデックス作成、サーバーへの転送の全自動化、windows XPからwindows8への転居
(2008.03.28 /2008.11.07/2008.12.04/2009.12.15/2009/12/31 ,2011/06/19, 2012/03/23、2013/11/04、2015/11/28)

Namazu(ver 2.0.21): [説明]

目次

はじめに

1.ダウンロード・インストールすべきソフト

2.ActivePerlのダウンロード・インストール
 1)ActivePerlのダウンロード・インストール
 2)perlインストール後の確認事項
参考:Windows画面からMS-DOSへの切り替えの方法

3.KAKASIのダウンロード・インストール
 1)KAKASI とは
 2)KAKASIのダウンロード・インストール
 3)インストール後の確認事項

4.Namazuのダウンロード・インストール
  1)
NAMAZUのダウンロード・インストール 
  
再起動後の確認事項
  3)namazuのフォルダ構成
  4)インストール後の確認事項

5.mknmzrc の設定
 1)mknmzrcの設定作業
   @ファイルの場所
   Amknmzrcの役割
   B使用するファイル
   Cmknmzrcの編集
 2)mknmzrcの動作確認

6.namazurcの設定作業
 1)namazurcの役割
 2)使用するファイルの場所 
 3)設定作業
  @パソコン内起動用namazurcの編集
  AWebのホームページ内起動用namazurcの編集

7.私のディレクトリ構造

8.インデックスを作りたいファイルの移管(私の場合はmsearch152)

9.pnamazuの導入
 1)pnamazuのダウンロード・インストール
 2)pnamazu.cgiの名前の変更と内容の確認
 3)アップロードとパーミッションの変更

10.インデックスの作成
 1)MS−DOS手動入力インデックス作成
 2)MS−DOS全自動入力インデックス作成

11.ホームぺージを置いているWebサイト(サーバー)へのFTPでのアップ作業
 1)アップロード
 2)パーミッションの変更

12. ホームページへの検索窓の設置

13.ホームページ上での検索

14.
インデックスの更新
 1)C:にあるインデックスを作りたいファイルに入れ替え
 2)前回作成したインデックスを保管してあるファイル64個すべてを削除
 3)インデックスの作成
 4)サーバー上のインデックス用ファイル64個の削除
 5)インデックス用ファイルのサーバーへの転送
 6)完了:

15Windows版namazu2.0.18へのバージョンアップの方法(namazu2.0.14→2.0.18 windows版)
Namazu 2.0.14 for Win32 β版→Namazu for Windows 2.0.18 ( アーカイブ001 )への変更

16namazuが突然indexの更新ができなくなった時の対応(namazuが突然動かない、更新できない)
今まで、うまくインデックスができていたのに、動き出してすぐ、とまってしまった。試行錯誤していろいろ悩んだ末、やっと原因をつかんだ(2009.10.29)。
 
1)ウイルスソフトが妨害
 2)index中(c:\namazu\var\namazu\index )の以前に作成したファイル64個が残ってないか?の以前に作成したファイル64個 が残ってないか?
 3)perlのバージョンがnamazuのバージョンに対応しているか?
 4)pathの確認
 5)長年namazuを使っていて、調子が悪くなったとき。たとえばPerl -vやkakasi -hが上手く起動する。しか
し、namazu --helpやmknmz -help, mknmz -Cが上手く起動しない場合の対処方法(2015/11/28)


17Windows版namazu2.0.21へのバージョンアップの方法.(namazu2.0.18→2.0.20 windows版
→2.0.21 windows版)

18.完全自動化(インデックス作成とサーバーへの転送)
1)インデックスの作成(@からBの完全自動化のためバッチファイルを作る)
@ローカルディスク(C:)のnamazuファイル中のindexファイルの削除
Aホームページ内のインデックスをつくりたいホルダーをローカルディスク(C:)へコピー
B新規インデックスの作成
C自動化
2)インデックス作成を完全自動化(タスク機能:コマンド使用:定時に起動)
3)作成インデックスのサーバーへの自動アップロード(定時に起動)
19.アクシデント

20.Windows XPからWindows8への乗り換えに伴うnamazu全文検索の引越方法
1). C:\ドライブにあるnamazu, perl, kakasiの引越
2). 環境変数の編集

付録
1.参考資料
2.私のパソコン環境
3.私の利用レンタルサーバー
4.私がnamazuを導入した理由


後述


はじめに

検索ソフトnamazuは国内で一番優れた部類に入る日本語全文検索システムです。CGI として動作させることによりご自分のホームページ内の全文検索システムを構築できます。ご自分が作成されたデータ量が多いと、すべてのファイルを検索するのでは非常に時間がかかるためインデックスを予めパソコン上で作成し、できあがったインデックスをご自分のホームページのサーバーにアップし、あなたのサイト内から検索単語を探すシステムになっています。これを起動させるにはすべてフリーソフトで導入できます。ダウンロード・インストール・設定はperl →kakasi→ namazu→ p-namazuの順に行う。この順番を変えるとうまく動かない。特にnamazuのバージョンは色々あり、バージョンによってはうまく導入できないので注意を要する。導入方法を順次説明する。最後に付録で、この設定に要した参考資料、私のパソコン環境にふれ、フリーソフトの導入・設定方法を順次ふれる。
設定を完了すると、ご自分のホームページのサイト内検索が可能になる。
2008.03.20 に初めて、namazuを導入しました。2008.11.07にコンピュータートラブルがあり、初期化しプログラムが全て消えたため、再度、導入しようと思い、このマニアルにそって実施しましたが、再現できませんでした。試行錯誤の上、Namazu 2.0.14 for Win32 β版のバージョンを利用することにより解決しました。perl, kakasiも下に記載のバージョンを利用されることをおすすめします。私の3台のパソコンに同じように導入できましたので再現性はあると思います。
なお、2008年11月07日にNamazu 2.0.14を導入した手順を示すとともに、2008年12月4日にNamazu 2.0.14からNamazu 2.0.18、2009年12月15日にNamazu 2.0.18からNamazu 2.0.20へ,2012年03月23日にNamazu 2.0.20からNamazu 2.0.21へ順次バージョンアップしたので、その方法を追加しました。
また操作の簡略化のためにインデックスの作成時の自動化、サーバーへの転送などの自動化にも成功したのでその方法についても記述した。MS-DOS画面も使うことになるが操作になれてない方のために基本的なことについてふれておく。
 
1.ダウンロード・インストールすべきソフト
 WindowsでNamazuを使用するには、次のツールが必要です。
インストールの手順は 1)perlのインスツール→再起動→kakasiのインスツール→namazuのインスツール→ 再起動 →p-namazuのインスツール
@Perl   :入手先 ActivePerl-5.6.1.633-MSWin32-x86.msi ,
最新版はnamazuがうまく起動しない。
AKAKASI :日本語分かち書きのためのツール
              →入手先kakasi-2.3.4.zip ( 1,058KB) (MD5sum: b8c243151f450a3c79a1482ad623b474) KAKASI for Win32
BNamzu  :Windows用Namazu
              →入手先 Namazu 2.0.14 for Win32 β版 (2004-12-15) 
http://namazu.org/~takesako/pub/nmz2014beta.exe

Cp-namazu :Perl版の作者古川令さんのpnamazu.cgiの最新バージョンはpnamazu-2006.12.23
                                          
2.ActivePerlのダウンロード・インストール

1)ActivePerlのダウンロード・インストール

ActivePerl-5.6.1.633-MSWin32-x86.msi を立ち上げインスツールします。しかし、現在ではperlは最新版になっており最新版で確認したところ、namazuがうまく起動しなかった。旧バージョン(ActivePerl-5.6.1.633-MSWin32-x86.msi)はnamazuはうまく起動したが、このバージョンは廃盤になっていてダウンロードできなくなった。
したがって、ここに以前保存していた旧バージョンをダウンロードできるようにしました。以下をダウンロードしたperl圧縮ファイルを解凍し,namazu を設置する箇所に保存してください。

 ActivePerl-5.6.1.633-MSWin32-x86.msiのダウンロード 

 圧縮ファイルの解凍ソフト(Lhaca076.EXE) 

 2)perlダウンロード後の確認事項
マイコンピューター→ローカルディスク(C:)にperlのフォルダが新規に作成されていて、そのフォルダの中に5つのフォルダ(bin, eg, html, lib, site)があることを確認する。

ついで、コントロールパネル→パーホーマンスとメンテナンス(クラシック表示の場合は直接システムを選択)→システム→詳細設定→環境変数タブ→システム環境変数を開き PATHにPerlのパスが書き込まれていることを確認。書き込まれていなければ、下段のシステム環境変数の編集タブをクリックして「編集」をクリックして書き込む。変数名に「Path」、変数値に「C:\perl\bin;%Path%;」と入力する。PATHにC:\:windows;がなければこれも書き込む。

※ここが間違いやすい!
「C:\perl\bin;%Path%;」は「
C:¥perl¥bin%Path%」です。binと%の間とPath%の後ろに「;」(セミコロン)を入れる。









 MS-DOSプロンプトを立ち上げ、「perl -v」と入力。画面が正常に表示されればインストール完了です。
※MS-DOSプロンプトは、スタート→すべてのプログラム→アクセサリ→コマンドプロンプトをダブルクリックしてで開きます。
C:\Documents and Settings\Owner>と出るのでcd c:\と打ち込むとC:\>とでるので
C:\>perl -v と入力しEnterを押す(perllと-との間は1コマあける)。

以下のように表示されればインスツール正常に完了です。
This is perl, v5.8.8 built for MSWin32-x86-multi-thread
(with 18 registered patches, see perl -V for more detail)

Copyright 1987-2007, Larry Wall

Binary build 822 [280952] provided by ActiveState http://www.ActiveState.c
Built Jul 31 2007 19:34:48

Perl may be copied only under the terms of either the Artistic License or
GNU General Public License, which may be found in the Perl 5 source kit.

Complete documentation for Perl, including FAQ lists, should be found on
this system using "man perl" or "perldoc perl". If you have access to the
Internet, point your browser at http://www.perl.org/, the Perl Home Page.


参考:Windows画面からMS-DOSへの切り替えの方法
スタート→すべてのプログラム→アクセサリー→コマンドプロンプト→「選択プロンプト」の画面がでて次のように表示される。
デスクトップ上の画面をコピーしたい時:FnキーとPrtScキー(または機種によってはCtrlPrint)を同時に押し、貼り付けたい箇所にペーストする。


図。DOS1

----------------------------------------------------------

1.C:\Documents and Settings\Administrator>cd C:\ と打ち、エンターを押すと以下の表示となる。
図。DOS2


この画面は閉じて再度開くとまた、図。DOS1に戻る。次回からもクリックしたときに図。DOS2 の画面を出したいときは次のようにする。
1)スタート→すべてのプログラム→アクセサリー→コマンドプロンプト→コピーしデスクトップに貼り付けた後、コマンドプロンプトをクリックすると図。DOS4の画面がでる。

図。DOS3



この画面の作業フォルダをC:\に変えて適用(A)を押し、OKボタンを押すと次回から立ち上がったときからC:\となっている。

図。DOS4


図。DOS5



2.MS-DOS上でコピーをしたい(MS-DOS→MS-DOS)とき 右クリック→「範囲指定」を選択→左クリックでコピーしたいところを、白く反転させる→Enter→コピーしたいところカーソルを持っていく→右クリック→貼り付け→Enter。

3.Windows画面からMS-DOS上にコピーしたい(Windows→MS-DOS)とき windows画面でコピーしたいところをコピーしたのち→MS-DOS画面上の C:\>のあとにカーソルをもっていき→右クリック→貼り付け→Enter。
4.MS-DOS画面からWindows上にコピーしたい(MS-DOS→Windows)とき 右クリック→「範囲指定」を選択→左クリックでコピーしたいところを、白く反転させる→EnterをおしWindowsのコピーしたいところにカーゾルをもっていき貼り付ける。


3.KAKASIのダウンロード・インストール
1)KAKASI とは:
KAKASIは漢字かなまじり文をひらがな文やローマ字文に変換することを目的として作成したプログラムと辞書の総称です。

2)KAKASIのダウンロード・インストール
kakasi-2.3.4.zip をダブルクリックすると解凍される。デスクトップ上にkakasi-2.3.4というフォルダができる。このフォルダをクリックし中にあるkakasiのフォルダ(フォルダ内にはbin,doc,include,lib,shareの5個のフォルダー、圧縮ファイル1個、9個のファイルが含まれる)内にある全てのファイルをコピーし、マイコンピュータ→ローカルディスク(C:)に貼り付ける。

Kakasi はインストールするだけで何ら変更する必要はありません。

なお、Namazu で利用するのは、実際には \kakasi\share\kakasi にある 2 個の辞書ファイル(kanwadictとitaijidict)だけです。

3)インストール後の確認事項
ついで、KAKASIの実行ディレクトリにPATHを通す。ActivePerlの時と同じく、システム環境変数、新規または編集で変数名「Path」、変数値「C:\kakasi\bin;%Path%;」と入力する。
※ここが間違いやすい! ※binの後ろの%との間の「;」(セミコロン)も忘れずに!
 MS-DOSプロンプトを立ち上げ、「kakasi -h」と入力、画面が正常に表示されればインストール完了です。

C:\>kakasi -h
KAKASI - Kanji Kana Simple Inverter Version 2.3.4
Copyright (C) 1992-1999 Hironobu Takahashi. All rights reserved.
Usage: kakasi -a[jE] -j[aE] -g[ajE] -k[ajKH] -E[aj] -K[ajkH] -H[ajkK] -J[ajkKH]
-i{oldjis,newjis,dec,euc,sjis} -o{oldjis,newjis,dec,euc,sjis}
-r{hepburn,kunrei} -p -s -f -c"chars" [jisyo1, jisyo2,,,]

Character Sets:
a: ascii j: jisroman g: graphic k: kana (j,k defined in jisx0201)
E: kigou K: katakana H: hiragana J: kanji(E,K,H,J defined in jisx0208)

Options:
-i: input coding system -o: output coding system
-r: romaji conversion system
-p: list all readings (with -J option)
-s: insert separate characters (with -J option)
-f: furigana mode (with -J option)
-c: skip chars within jukugo (with -J option: default TAB CR LF BLANK)
-C: romaji Capitalize (with -Ja or -Jj option)
-U: romaji Upcase (with -Ja or -Jj option)
-u: call fflush() after 1 character output
-w: wakatigaki mode

Report bugs to <bug-kakasi@namazu.org>.

ここでの再起動は不要です。次に行きましょう。



4.Namazuのダウンロード・インストール
1)NAMAZUのダウンロード・インストール 
namazuはいままでに幾度も改訂されてきました。そこで現時点で最新版に当たる
nmz2.0.18.001-win32.zip(http://www.akaneiro.jp/public/nmz2.0.18.001-win32.zip)やnmz2.0.17.001-win32.zip(http://www.akaneiro.jp/public/nmz2.0.17.001-win32.zip)をインスツールしたが、いずれもファイルがないとかいろいろ、メニューが出て起動がしなかった(たとえば次のようなメニューが出た。
Installing package 'File-MMagic.ppd'... Error installing package 'File-MMagic.ppd': Read a PPD for 'File-MMagic.ppd', but it is not intended for this build of Perl (MSWin32-x86-multi-thread)
あるいは

Can't locate loadable object for module NKF in @INC (@INC contains: C:/namazu/share/namazu/filter/win32 C:/namazu/share/namazu/filter C:/namazu/share/namazu/pl. C:/Perl/lib C:/Perl/site/lib) at C:\namazu\bin/mknmz line 881Compilation failed in require at C:\namazu\bin/mknmz line 881.

というエラーが出ました。いろいろさわっても、解決しないので、そこで思い切って古いが、先人が導入された記録を見てNamazu 2.0.14 for Win32 β版 (2004-12-15)  http://namazu.org/~takesako/pub/nmz2014beta.exeを導入したらあっさりと解決し、namazuがうまく起動したので経過について説明する。

namazu のインストールは以下のようにします。ダウンロードした EXE ファイルにはインストーラが組み込まれているので、これを実行すると、以下のように、OKを押すだけで、メニューが勝手に自動的に進み(Windows xp の場合)、ローカルディスク(C:)に保存します。


(1)言語の選択
セットアップで使用する言語を選択してください。
Japaneseを選択しOKを押す。

(2)Namazu for Win32セットアップ
ウイザードの開始→OK

(3)セットアップ
セットアップの画面が出る。すでにインスツールしているのでさわらず
次へを押す


(4)インストール先の指定
C:namazu→次へ

(5)コンポーネントの選択
全てインスツール→次へ

(6)スタートメニューフォルダの指定
namazu for win32→先へ

(7)追加タスクの選定(namazu for win32の動作に必要な環境変数の設定)
以下の全ての項目にチェックを入れる。
ロケールの設定
kakasiの辞書ファイル
namazuの設定ファイル
Pathに実行パスの追加
perlモジュールのインスツール(PPM-install.bat自動実行)
→次へ

(8)ロケールの設定
環境変数 ja_JP.SJIS
 →次へ

(9)kakasiの辞書ファイル
環境変数 KANWADICTPATH
ロケールの設定
kakasiの辞書ファイル
namazuの設定ファイル
Pathに実行パスの追加
perlモジュールのインスツール(PPM-install.bat自動実行)C:\kakasi\share\kakasi\kanwadict

環境変数 ITAIJIDICTPATH
C:\kakasi\share\kakasi\itaijidict
→次へ

(10) 環境変数MKNMZRC、環境変数NAMAZURC
環境変数MKNMZRC
C:\namazu\etc\namazu\mknmzrc

環境変数NAMAZURC
C:\namazu\etc\namazu\namazurc
→次へ

(11)環境変数NAMAZULOCALEDIR、環境変数pkgdatadir
環境変数NAMAZULOCALEDIR
C:\namazu\share\locale

環境変数pkgdatadir
C:\namazu\share\namazu
→次へ

(12)Pathの追加
追加するフォルダ
C:\namazu\bin
→次へ

(13)インストールの準備完了
スタートメニュー:
Namazu for Win32

追加タスク一覧:
Namazu for Win32 の動作に必要な環境変数を設定する
ロケールの設定
Kakasiの辞書ファイル
Namazuの設定ファイル
PATHに実行パスを追加
Perlモジュールのインストール(PPM-INSTALL.BATの自動実行)

環境変数:
LANG=ja_JP.SJIS
KANWADICTPATH=C:\kakasi\share\kakasi\kanwadict
ITAIJIDICTPATH=C:\kakasi\share\kakasi\itaijidict
MKNMZRC=C:\namazu\etc\namazu\mknmzrc
NAMAZURC=C:\namazu\etc\namazu\namazurc
NAMAZULOCALEDIR=C:\namazu\share\locale
pkgdatadir=C:\namazu\share\namazu

PATHの追加:
追加するフォルダ=C:\namazu\bin
→インストール

(14)MS-DOSが自動起動する
------------------------------------------------------
Perl modules Installer for Windows ActivePerl
------------------------------------------------------
Changed directory to C:/namazu/ppm/600

>>> call PPM.BAT install File-MMagic.ppd
Installing package 'File-MMagic.ppd'...
Writing C:\Perl\site\lib\auto\File\MMagic\.packlist

>>> call PPM.BAT install NKF.ppd
Installing package 'NKF.ppd'...
Writing C:\Perl\site\lib\auto\NKF\.packlist

>>> call PPM.BAT install Search-Namazu.ppd
Installing package 'Search-Namazu.ppd'...
Writing C:\Perl\site\lib\auto\Search\Namazu\.packlist

>>> call PPM.BAT install Text-Kakasi.ppd

(15)完了
再度、パソコンを再起動する。


2)再起動後の確認事項
再起動後、MS-DOSプロンプトを立ち上げ、「mknmz」と「
namazu --help(namazuのあと、ひとコマあけてーを2個打ちhelpと打つ)」と入力、以下のように表示されればインストール完了です。
--------------------------------------------------------------
C:\>mknmz
使い方: mknmz [オプション] <対象>...
mknmz --help でより詳しい情報が表示されます
コマンドプロンプト(MS-DOS プロンプト)で以下のコマンドを実行します。
-------------------------------------------------------------
つづいてコマンドプロンプト(MS-DOS プロンプト)namazu --helpを入力し、下のように起動したら成功です。namazuのインスツールにやっと成功しました。
C:\>namazu --help
namazu 2.0.14, Namazu の検索プログラム

使い方: namazu [options] <query> [index]...
-n, --max=NUM 一度に表示する件数
-w, --whence=NUM 表示する検索結果の先頭番号
-l, --list 検索結果を URI・パス名をリストで出力する
-s, --short 短い書式で出力する
--result=EXT 結果表示に用いる NMZ.result.EXT を指定する
--late 検索結果を新しい順にソートする
--early 検索結果を古い順にソートする
--sort=METHOD ソート方法を指定する (score, date, field:name)
--ascending ソートの方向を昇順にする (標準は降順)
-a, --all 検索結果をすべて表示する
-c, --count ヒット数のみを表示する
-h, --html HTMLで出力する
-r, --no-references 参考ヒット数を表示しない
-H, --page 先の検索結果へのリンクを表示する (ほぼ無意味)
-F, --form <form> ... </form> の部分を強制的に表示する
-R, --no-replace URI の置き換えを行わない
-U, --no-decode-uri URI encode の復元を行わない
-o, --output=FILE 指定したファイルに検索結果を出力する
-f, --config=FILE 設定ファイルを指定する
-C, --show-config 設定を表示する
-q, --quiet 検索結果以外のメッセージを表示しない
-d, --debug デバッグモード
-v, --version ヴァージョンを表示する
--help このヘルプを表示する

バグ報告は <bug-namazu@namazu.org> へどうぞ
--------------------------------------------------------------

3)namazuのフォルダ構成
Namazu は以下のフォルダ構成でインストールされているはずです。

namazu Namazu の親フォルダです。
bin Namazu 本体(namazu.exe)と Perl スクリプト、各種処理用のバッチファイルが入っています。
etc Namazu の環境設定ファイル NAMAZURC のテンプレートが入っています。
include インクルードファイルが入っています。
lib ライブラリが入っています。
libexec Namazu を CGI で使うときの実行プログラム namazu.cgi.exe が入っています。
man man ファイルが入っています。
share 各種の共有ファイル、日本語/英語のドキュメント、フィルタ用スクリプト、HTML 部品などが入っています。
var 検索用インデックスファイルが格納されるフォルダです。
ppm Windows ActivePerl専用バイナリモジュール


4)インストール後の確認事項
次に、Namazu のインストーラが何をしたかを確認する。

Namazu をインストールすると、そのインストーラは [コントロールパネル] - [パーフォーマンスとメンテナンス] -[システム] - [環境] タブのシステム環境変数 PATH に、パス \namazu\bin を追加し、さらに以下の環境変数を新規に追加。もしなければ新規に追加する。


 HOME  C:\namazu
 ITAIJIDICTPATH  C:\kakasi\share\kakasi\itaijidict
 KANWADICTPATH  C:\kakasi\share\kakasi\kanwadict
 LANG  ja_JP.SJIS
 MKNMZRC  C:\namazu\etc\namazu\mkmnzrc
 NAMAZULOCALEDIR  C:\namazu\share\locale
 NAMAZURC    C:\namazu\etc\namazu\namazurc

★ それぞれの環境変数について

  • 環境変数 HOME は、Namazu のホームディレクトリを指定する。
  • 環境変数 ITAIJIDICPATH と KANWADICTPATH は、Namazu から参照する Kakasi の辞書ファイルの場所を指定する。
  • 環境変数 LANG は、Namazu を日本語環境で利用するための指定です。
  • 環境変数 MKNMZ は、MKNMZ コマンド(\namazu\bin\mknmz.bat)のための環境設定ファイルへのフルパスです。MKNMZ コマンドは検索インデックスを作成するときに使う。
  • 環境変数 NAMAZULOCALEDIR は言語情報ファイルがどこにあるかを指定する。
  • 環境変数 NAMAZURC は Namazu の環境設定ファイルへのフルパスです。

mknmzrc の設定

Namazu のインストール/セットアップによって、c:\namazu\etc\namazu に mknmzrcnamazurc という 2 つのファイルが作成されます。これらは、それぞれインデックス作成コマンド mknmz(\namazu\bin\mknmz.bat)のための環境設定ファイル(mknmzrc)と、Namazu検索を実施するときの設定ファイル(namazurc)です。ここではmknmzrcの設定、次項でnamazurcの設定について述べる。

1)mknmzrcの設定作業

@ファイルの場所
  C:\namazu\etc\namazu

Amknmzrcの役割
 インデックス作成プログラム mknmz の動作を設定するリソースファイル。

B使用するファイル
 
a)上記フォルダ内ののmknmzrc、mknmzrc-sample、mknmzrc-sample.win32は全て同じ内容。
 b)mknmzrcをそのまま使用する。

Cmknmzrcの編集
a)エディタでmknmzrcを開き、以下に示す各行のコメント(#)を外す。説明文はそのまま残します。

b)編集内容
 メールアドレスを自分のもの(赤字)に変更する以外は、行頭の#を外すだけです。
PDFは重いので最大ファイルサイズを大きく設定( # $FILE_SIZE_MAX = 200000000;
最大ファイルサイズを大きく設定
# $TEXT_SIZE_MAX = 600000000)設定する。
#
# This is a Namazu configuration file for mknmz.
#
package conf; # Don't remove this line!

#===================================================================
#
# Administrator's email address
$ADDRESS = 'take0627@lilac.ocn.ne.jp';


#===================================================================
#
# Regular Expression Patterns
#

#
# This pattern specifies HTML suffixes.
#
$HTML_SUFFIX = "html?|[ps]html|html\\.[a-z]{2}";

#
# This pattern specifies file names which will be targeted.
# NOTE: It can be specified by --allow=regex option.
# Do NOT use `$' or `^' anchors.
# Case-insensitive.
#
$ALLOW_FILE = ".*\\.(?:$HTML_SUFFIX)|.*\\.txt" . # HTML, plain text
"|.*\\.gz|.*\\.Z|.*\\.bz2" . # Compressed files
"|.*\\.pdf|.*\\.ps" . # PDF, PostScript
"|.*\\.tex|.*\\.dvi" . # TeX, DVI
"|.*\\.rpm|.*\\.deb" . # RPM, DEB
"|.*\\.doc|.*\\.xls|.*\\.pp[st]" . # Word, Excel, PowerPoint "|.*\\.docx|.*\\.xlsx|.*\\.pp[st]x" . # MS-OfficeOpenXML Word, Excel, PowerPoint
"|.*\\.vs[dst]|.*\\.v[dst]x" . # Visio
"|.*\\.j[sabf]w|.*\\.jtd" . # Ichitaro 4, 5, 6, 7, 8
# "|.*\\.sx[widc]" . # OpenOffice Writer,Calc,Impress,Draw
# "|.*\\.od[tspg]" . # OpenOffice2.0
# "|.*\\.rtf" . # Rich Text Format
# "|.*\\.hdml|.*\\.mht" . # HDML MHTML
# "|.*\\.mp3" . # MP3
# "|.*\\.gnumeric" . # Gnumeric
# "|.*\\.kwd|.*\\.ksp" . # KWord, KSpread
# "|.*\\.kpr|.*\\.flw" . # KPresenter, Kivio
"|.*\\.eml|\\d+|[-\\w]+\\.[1-9n]"; # Mail/News, man

#
# This pattern specifies file names which will NOT be targeted.
# NOTE: It can be specified by --deny=regex option.
# Do NOT use `$' or `^' anchors.
# Case-insensitive.
#
$DENY_FILE = ".*\\.(gif|png|jpg|jpeg)|.*\\.tar\\.gz|core|.*\\.bak|.*~|\\..*|\x23.*";

#
# This pattern specifies DDN(DOS Device Name) which will NOT be targeted.
# NOTE: Only for Windows.
# Do NOT use `$' or `^' anchors.
# Case-insensitive.
#
# $DENY_DDN = "con|aux|nul|prn|lpt[1-9]|com[1-9]|clock\$|xmsxxxx0";

#
# This pattern specifies PATHNAMEs which will NOT be targeted.
# NOTE: Usually specified by --exclude=regex option.

$EXCLUDE_PATH = undef;

#
# This pattern specifies file names which can be omitted
# in URI. e.g., 'index.html|index.htm|Default.html'
#
# NOTE: This is similar to Apache's "DirectoryIndex" directive.
$DIRECTORY_INDEX = "";

#
# This pattern specifies Mail/News's fields in its header which
# should be searchable. NOTE: case-insensitive
$REMAIN_HEADER = "From|Date|Message-ID";

#
# This pattern specifies fields which used for field-specified
# searching. NOTE: case-insensitive
$SEARCH_FIELD = "message-id|subject|from|date|uri|newsgroups|to|summary|size";

#
# This pattern specifies meta tags which used for field-specified
# searching. NOTE: case-insensitive
$META_TAGS = "keywords|description";

#
# This pattern specifies aliases for NMZ.field.* files.
# NOTE: Editing NOT recommended.
%FIELD_ALIASES = ('title' => 'subject', 'author' => 'from');

#
# This pattern specifies HTML elements which should be replaced with
# null string when removing them. Normally, the elements are replaced
# with a single space character.
$NON_SEPARATION_ELEMENTS = 'A|TT|CODE|SAMP|KBD|VAR|B|STRONG|I|EM|CITE|FONT|U|'.
'STRIKE|BIG|SMALL|DFN|ABBR|ACRONYM|Q|SUB|SUP|SPAN|BDO';

#
# This pattern specifies attribute of a HTML tag which should be
# searchable.
#
# $HTML_ATTRIBUTES = 'ALT|SUMMARY|TITLE';


#===================================================================
#
# Critical Numbers
#

#
# The max size of files which can be loaded in memory at once.
# If you have much memory, you can increase the value.
# If you have less memory, you can decrease the value.
$ON_MEMORY_MAX = 5000000;

#
# The max file size for indexing. Files larger than this
# will be ignored.
# NOTE: This value is usually larger than TEXT_SIZE_MAX because
# binary-formated files such as PDF, Word are larger.
$FILE_SIZE_MAX = 200000000;

#
# The max text size for indexing. Files larger than this
# will be ignored.
$TEXT_SIZE_MAX = 600000000;

#
# The max length of a word. the word longer than this will be ignored.
$WORD_LENG_MAX = 128;


#
# Weights for HTML elements which are used for term weightning.
#
%Weight =
(
'html' => {
'title' => 16,
'h1' => 8,
'h2' => 7,
'h3' => 6,
'h4' => 5,
'h5' => 4,
'h6' => 3,
'a' => 4,
'strong' => 2,
'em' => 2,
'kbd' => 2,
'samp' => 2,
'var' => 2,
'code' => 2,
'cite' => 2,
'abbr' => 2,
'acronym'=> 2,
'dfn' => 2,
},
'metakey' => 32, # for <meta name="keywords" content="foo bar">
'headers' => 8, # for Mail/News' headers
);

#
# The max length of a HTML-tagged string which can be processed for
# term weighting.
# NOTE: There are not a few people has a bad manner using
# <h[1-6]> for changing a font size.
#
$INVALID_LENG = 128;

#
# The max length of a field.
# This MUST be smaller than libnamazu.h's BUFSIZE (usually 1024).
#
$MAX_FIELD_LENGTH = 200;


#===================================================================
#
# Softwares for handling a Japanese text
#

#
# Network Kanji Filter nkf v1.71 or later
#
$NKF = "module_nkf";

#
# KAKASI 2.x or later
# Text::Kakasi 1.05 or later
#
$KAKASI = "module_kakasi -ieuc -oeuc -w";

#
# ChaSen 2.02 or later (simple wakatigaki)
# Text::ChaSen 1.03
#
# $CHASEN = "module_chasen -i e -j -F \"\%m \"";

#
# ChaSen 2.02 or later (with noun words extraction)
#
# $CHASEN_NOUN = "module_chasen -i e -j -F \"\%m %H\\n\"";

#
# MeCab
#
# $MECAB = "module_mecab -Owakati -b 8192";

#
# Default Japanese processer: KAKASI or ChaSen.
#
$WAKATI = $KAKASI;


#===================================================================
#
# Directories
#
$LIBDIR = 'C:/namazu/share/namazu/pl';
$FILTERDIR = 'C:/namazu/share/namazu/filter';
$TEMPLATEDIR = 'C:/namazu/share/namazu/template';
1;

--------------------------------------------------------------

c)変更終了後上書き保存

2).mknmzrcの動作確認 
a).  MS-DOSプロンプト(NT系はコマンドプロンプト)を開き以下を実行。
   C:\Documents and Settings\Owner>とでるのでcd c:\と打ち込むとC:\>とでる
b.).  MS-DOSプロンプトを立ち上げ、「mknmz -C」(オプション-CのCは必ず大文字)と入力、以下のようにに表示されればmknmzrcは正常です。

C:\>mknmz -C
読み込んだ設定ファイル: C:/namazu/etc/namazu/mknmzrc
システム: MSWin32
Namazu: 2.0.12
Perl: 5.006001
NKF: module_nkf
KAKASI: module_kakasi -ieuc -oeuc -w
茶筌: chasen -j -F '%m '
わかち書き: module_kakasi -ieuc -oeuc -w
メッセージの言語: ja_JP.SJIS
言語: ja_JP.SJIS
文字コード: sjis
CONFDIR: C:/namazu/etc/namazu
LIBDIR: C:/namazu/share/namazu/pl
FILTERDIR: C:/namazu/share/namazu/filter
TEMPLATEDIR: C:/namazu/share/namazu/template
対応メディアタイプ:
application/excel
application/ichitaro4
application/ichitaro5
application/ichitaro6
application/ichitaro7
application/msword
application/pdf
application/rtf
application/x-gzip
application/x-js-taro
message/news
message/rfc822
text/hnf
text/html
text/html; x-type=mhonarc
text/plain
text/plain; x-type=rfc
text/x-hdml

*****************************


6.namazurcの設定作業
1)namazurcの役割
namazurcはnamazuを実行させるたファイル。
namazurcは@パソコン内でnamasuを起動させる場合とAWeb上でnamazuを起動させる場合の2つを用意する。順に設置方法を述べる。

※ここが間違いやすい! namazurcはダウンロードしたままではパソコン上でもURLの上でも、正しく表示されませんので、「namazurc」をエディタで開き、以下の様に変更して下さい。
namazurcはパソコン内起動用とWebのホームページ内起動用の2つのファイルを別設定する。

2)使用するファイルの場所
 
C:\namazu\etc\namazuのフォルダの中にnamazurc-sample、namazurc-sample.win32があるが全て同じ内容。エディタでC:\namazu\etc\namazuのフォルダを開く。ファイルが見あたらなければ下の「ファイルの種類(T)」を「ユーザー」から「すべてのファイル(**)」に切り替える。namazurc-sampleを使用する場合は、sampleをとってnamazurcと名前を変えて保存する(フォルダを右クリックし名前の変更(M)をする)。このnamazurcをパソコン内起動用namazurcとする。次に、Webのホームページ内起動用namazurcを作るが同じ名前のためC:にWeb用Foldaのフォルダを作る(フォルダの作り方はローカルディスク(C:)の画面でマウスを右クリックし新規作成→フォルダ(F)を開き名前をWeb用Foldaと入力する)。このフォルダに上で作ったパソコン内起動用namazurcをコピーし、以下のごとく編集する。

3)設定作業
@パソコン内起動用namazurcの編集
C:\namazu\etc\namazuのフォルダの中のnamazurcをエディタで開き、以下の箇所を変更する。赤字が修正箇所であり、行頭の#をはずす箇所とそのままの箇所があります。変更終了後、C:にWeb用Foldaのフォルダの中に保存。
-------------------------------------------------------------

# This is a Namazu configuration file for namazu or namazu.cgi.
#
# Originally, this file is named 'namazurc-sample'. so you should
# copy this to 'namazurc' to make the file effective.
#
# Each item is must be separated by one or more SPACE or TAB characters.
# You can use a double-quoted string for represanting a string which
# contains SPACE or TAB characters like "foo bar baz".


##
## Index: Specify the default directory.

Index C:\msearch152

##
## Template: Set the template directory containing
## NMZ.{head,foot,body,tips,result} files.

Template C:\namazu\var\namazu\index


##
## Replace: Replace TARGET with REPLACEMENT in URIs in search
## results.
##
## TARGET is specified by Ruby's perl-like regular expressions.
## You can caputure sub-strings in TARGET by surrounding them
## with `(' and `)'and use them later as backreferences by
## \1, \2, \3,... \9.
##
## To use meta characters literally such as `*', `+', `?', `|',
## `[', `]', `{', `}', `(', `)', escape them with `\'.
##
## e.g.,
##
# Replace / http://biwa28.lolipop.jp/
## Replace /msearch152/(.*)/ http://biwa28.lolipop.jp/
## Replace /C\|/msearch152/ http://biwa28.lolipop.jp/

##
## If you do not want to do the processing on command line use,
## run namazu with -U option.
##
## You can specify more than one Replace rules but the only
## first-matched rule are applied.

#Replace /http://biwa28.lolipop.jp/


##
## Logging: Set OFF to turn off keyword logging to NMZ.slog.
## Default is ON.

#Logging off


##
## Lang: Set the locale code such as `ja_JP.eucJP', `ja_JP.SJIS',
## `de', etc. This directive works only if the environment
## variable LANG is not set because the directive is mainly
## intended for CGI use. On the shell, You can set
## environemtnt variable LANG instead of using the directive.
##
## If you set `de' to it, namazu.cgi use
## NMZ.(head|foot|body|tips|results).de for displaying results
## and use a proper message catalog for `de'.

Lang ja_JP.SJIS


##
## Scoring: Set the scoring method "tfidf" or "simple".

Scoring tfidf


##
## EmphasisTags: Set the pair of html elements which is used in
## keyword emphasizing for search results.

EmphasisTags "<strong class=\"keyword\">" "</strong>"

##
## MaxHit: Set the maximum number of documents which can be
## handled in query operation. If documents matching a
## query exceed the value, they will be ignored.

MaxHit 10000

##
## MaxMatch: Set the maximum number of words which can be
## handled in regex/prefix/inside/suffix query. If documents
## matching a query exceed the value, they will be ignored.

MaxMatch 1000

##
## ContentType: Set "Content-Type" header output. If you want to
## use non-HTML template files, set it suitably.
#ContentType "text/x-hdml"

-------------------------------------------------------------

Index C:\msearch152 Index 指令は、インデックスしたいファイルを指定します。msearch152はmsearchエンジンのことではなく私が勝手に作ったフォルダでここに私がインデックス化したいTable1〜Table43のファイルが納めてある。正確にはC:\msearch152\drugstore←このディレクトリにTable1からTable43が入っている。
Template C:\namazu\var\namazu\index インデックスを作ったファイルを格納しておく場所
# Replace / http://biwa28.lolipop.jp/
## Replace /msearch152/(.*)/ http://biwa28.lolipop.jp/
## Replace /C\|/msearch152/ http://biwa28.lolipop.jp/
Replace 指令は、Namazu による検索では通常はファイル名の先頭にディレクトリ名を入れて検索結果を出力しますが、CGI で使う場合はそれでは困るのでディレクトリ名部分をURL に置き換えるためにあります。この指令を有効にするときは行の先頭にある文字 # を削除します。CGI を利用する場合の設定については後述します。なお、Replace 指令は複数の定義を行うことができるので、たとえばバーチャルドメインサービスを行っている場合、ドメインごとの定義を行うことができる。
#Logging off Logging 指令は、検索に使われたキーワードのログを残すかどうかを指定します。残さない場合は、# を削除して行を有効にします。デフォルトではログを取ります。
Lang ja_JP.SJIS Lang 指令は、使用する言語を指定します。Namazu を日本語環境で使うときは ja_JP.SJIS にします。英語環境で使うときは行頭に # を入れます。
Scoring tfidf Scoring 指令は、スコアの重みづけ方法を指定します。デフォルトは simple です。TF IDF 法にする場合は先頭の # を削除します。IF IDF 法については、\namazu\share\namazu\doc にある manual.html を見てください。
重みづけとは、ドキュメント中の HTML タグの種類やその出現回数に応じてドキュメントの重要度を決めるものです。以下の HTML タグが評価されます。
<TITLE> <H1>〜<H6> <A> <STRONG> <EM> <CODE> <KBD> <SAMP> <CITE> <VAR>
対象ページが HTML の正しい論理構造を持っている場合は重みづけの効果があります。
EmphasisTags "<strong class=\"keyword\">"  "</strong>" Namazu 2.0 からは HTML ドキュメントの検索でヒットした部分を強調表示できるようになりました。強調表示を行うには行頭の # を削除します。
MaxHit 10000 MaxHit 指令は、1 回の検索によるヒット件数の上限を指定します。ここで指定した数よりも多くのドキュメントが見つかっても、それらは無視されます。
MaxMatch 1000 MaxMatch 指令は、検索によってマッチする語の上限を指定します。
ContentType "text/x-hdml"

ContentType 指令は、HTML 文書以外のテンプレートファイルを利用する場合に、その Content-Type: を指定します。この段階では namazurc ファイルの内容を変更する必要はありません。


AWebのホームページ内起動用namazurcの編集

ついで、上で設定したC:にWeb用Folda内のnamazurcをWeb上で起動するように編集する。Web用Foldaのフォルダの中のnamazurcをエディタで開く。
ファイルが見あたらなければ下の「ファイルの種類(T)」を「ユーザー」から「すべてのファイル(**)」に切り替える。




赤字
が修正箇所であり、変更終了後上書き保存する。

# This is a Namazu configuration file for namazu or namazu.cgi.
#
# Originally, this file is named 'namazurc-sample'. so you should
# copy this to 'namazurc' to make the file effective.
#
# Each item is must be separated by one or more SPACE or TAB characters.
# You can use a double-quoted string for represanting a string which
# contains SPACE or TAB characters like "foo bar baz".


##
## Index: Specify the default directory.

Index cgi-bin

##
## Template: Set the template directory containing
## NMZ.{head,foot,body,tips,result} files.

#Template C:\namazu\var\namazu\index



##
## Replace: Replace TARGET with REPLACEMENT in URIs in search
## results.
##
## TARGET is specified by Ruby's perl-like regular expressions.
## You can caputure sub-strings in TARGET by surrounding them
## with `(' and `)'and use them later as backreferences by
## \1, \2, \3,... \9.
##
## To use meta characters literally such as `*', `+', `?', `|',
## `[', `]', `{', `}', `(', `)', escape them with `\'.
##
## e.g.,
##
# Replace / http://biwa28.lolipop.jp/
## Replace /msearch152/(.*)/ http://biwa28.lolipop.jp/\1/
## Replace /C\|/msearch152/ http://biwa28.lolipop.jp/

##
## If you do not want to do the processing on command line use,
## run namazu with -U option.
##
## You can specify more than one Replace rules but the only
## first-matched rule are applied.

Replace /C\|/ http://biwa28.lolipop.jp/


##
## Logging: Set OFF to turn off keyword logging to NMZ.slog.
## Default is ON.

#Logging off


##
## Lang: Set the locale code such as `ja_JP.eucJP', `ja_JP.SJIS',
## `de', etc. This directive works only if the environment
## variable LANG is not set because the directive is mainly
## intended for CGI use. On the shell, You can set
## environemtnt variable LANG instead of using the directive.
##
## If you set `de' to it, namazu.cgi use
## NMZ.(head|foot|body|tips|results).de for displaying results
## and use a proper message catalog for `de'.

Lang ja_JP.SJIS


##
## Scoring: Set the scoring method "tfidf" or "simple".

Scoring tfidf


##
## EmphasisTags: Set the pair of html elements which is used in
## keyword emphasizing for search results.

EmphasisTags "<strong class=\"keyword\">" "</strong>"

##
## MaxHit: Set the maximum number of documents which can be
## handled in query operation. If documents matching a
## query exceed the value, they will be ignored.

MaxHit 10000

##
## MaxMatch: Set the maximum number of words which can be
## handled in regex/prefix/inside/suffix query. If documents
## matching a query exceed the value, they will be ignored.

MaxMatch 1000

##
## ContentType: Set "Content-Type" header output. If you want to
## use non-HTML template files, set it suitably.
#ContentType "text/x-hdml"
Replace /C\|/ http://biwa28.lolipop.jp/


##
## Logging: Set OFF to turn off keyword logging to NMZ.slog.
## Default is ON.

#Logging off


##
## Lang: Set the locale code such as `ja_JP.eucJP', `ja_JP.SJIS',
## `de', etc. This directive works only if the environment
## variable LANG is not set because the directive is mainly
## intended for CGI use. On the shell, You can set
## environemtnt variable LANG instead of using the directive.
##
## If you set `de' to it, namazu.cgi use
## NMZ.(head|foot|body|tips|results).de for displaying results
## and use a proper message catalog for `de'.

Lang ja_JP.SJIS


##
## Scoring: Set the scoring method "tfidf" or "simple".

Scoring tfidf


##
## EmphasisTags: Set the pair of html elements which is used in
## keyword emphasizing for search results.

EmphasisTags "<strong class=\"keyword\">" "</strong>"

##
## MaxHit: Set the maximum number of documents which can be
## handled in query operation. If documents matching a
## query exceed the value, they will be ignored.

MaxHit 10000

##
## MaxMatch: Set the maximum number of words which can be
## handled in regex/prefix/inside/suffix query. If documents
## matching a query exceed the value, they will be ignored.

MaxMatch 1000

##
## ContentType: Set "Content-Type" header output. If you want to
## use non-HTML template files, set it suitably.
#ContentType "text/x-hdm
l"

 


重複するがパソコン内namazurcとWeb内用namazurcを対比して示すと次のようになる。

パソコン内起動用

web内起動用

# This is a Namazu configuration file for namazu or namazu.cgi.
#
# Originally, this file is named 'namazurc-sample'. so you should
# copy this to 'namazurc' to make the file effective.
#
# Each item is must be separated by one or more SPACE or TAB characters.
# You can use a double-quoted string for represanting a string which
# contains SPACE or TAB characters like "foo bar baz".


##
## Index: Specify the default directory.

Index C:\msearch152

##
## Template: Set the template directory containing
## NMZ.{head,foot,body,tips,result} files.

Template C:\namazu\var\namazu\index


##
## Replace: Replace TARGET with REPLACEMENT in URIs in search
## results.
##
## TARGET is specified by Ruby's perl-like regular expressions.
## You can caputure sub-strings in TARGET by surrounding them
## with `(' and `)'and use them later as backreferences by
## \1, \2, \3,... \9.
##
## To use meta characters literally such as `*', `+', `?', `|',
## `[', `]', `{', `}', `(', `)', escape them with `\'.
##
## e.g.,
##
# Replace / http://biwa28.lolipop.jp/
## Replace /msearch152/(.*)/ http://biwa28.lolipop.jp/
## Replace /C\|/msearch152/ http://biwa28.lolipop.jp/

##
## If you do not want to do the processing on command line use,
## run namazu with -U option.
##
## You can specify more than one Replace rules but the only
## first-matched rule are applied.

#Replace /http://biwa28.lolipop.jp/


##
## Logging: Set OFF to turn off keyword logging to NMZ.slog.
## Default is ON.

#Logging off


##
## Lang: Set the locale code such as `ja_JP.eucJP', `ja_JP.SJIS',
## `de', etc. This directive works only if the environment
## variable LANG is not set because the directive is mainly
## intended for CGI use. On the shell, You can set
## environemtnt variable LANG instead of using the directive.
##
## If you set `de' to it, namazu.cgi use
## NMZ.(head|foot|body|tips|results).de for displaying results
## and use a proper message catalog for `de'.

Lang ja_JP.SJIS


##
## Scoring: Set the scoring method "tfidf" or "simple".

Scoring tfidf


##
## EmphasisTags: Set the pair of html elements which is used in
## keyword emphasizing for search results.

EmphasisTags "<strong class=\"keyword\">" "</strong>"

##
## MaxHit: Set the maximum number of documents which can be
## handled in query operation. If documents matching a
## query exceed the value, they will be ignored.

MaxHit 10000

##
## MaxMatch: Set the maximum number of words which can be
## handled in regex/prefix/inside/suffix query. If documents
## matching a query exceed the value, they will be ignored.

MaxMatch 1000

##
## ContentType: Set "Content-Type" header output. If you want to
## use non-HTML template files, set it suitably.
#ContentType "text/x-hdml"

# This is a Namazu configuration file for namazu or namazu.cgi.
#
# Originally, this file is amed 'namazurc-sample'. so you should
# copy this to 'namazurc' to make the file effective.
#
# Each item is must be separated by one or more SPACE or TAB characters.
# You can use a double-quoted string for represanting a string which
# contains SPACE or TAB characters like "foo bar baz
".


##
## Index: Specify the default directory.

Index cgi-bin

##
## Template: Set the template directory containing
## NMZ.{head,foot,body,tips,result} files.

#Template C:\namazu\var\namazu\index



##
## Replace: Replace TARGET with REPLACEMENT in URIs in search
## results.
##
## TARGET is specified by Ruby's perl-like regular expressions.
## You can caputure sub-strings in TARGET by surrounding them
## with `(' and `)'and use them later as backreferences by
## \1, \2, \3,... \9.
##
## To use meta characters literally such as `*', `+', `?', `|',
## `[', `]', `{', `}', `(', `)', escape them with `\'.
##
## e.g.,
##
# Replace / http://biwa28.lolipop.jp/
## Replace /msearch152/(.*)/ http://biwa28.lolipop.jp/\1/
## Replace /C\|/msearch152/ http://biwa28.lolipop.jp/

##
## If you do not want to do the processing on command line use,
## run namazu with -U option.
##
## You can specify more than one Replace rules but the only
## first-matched rule are applied.

Replace /C\|/ http://biwa28.lolipop.jp/


##
## Logging: Set OFF to turn off keyword logging to NMZ.slog.
## Default is ON.

#Logging off


##
## Lang: Set the locale code such as `ja_JP.eucJP', `ja_JP.SJIS',
## `de', etc. This directive works only if the environment
## variable LANG is not set because the directive is mainly
## intended for CGI use. On the shell, You can set
## environemtnt variable LANG instead of using the directive.
##
## If you set `de' to it, namazu.cgi use
## NMZ.(head|foot|body|tips|results).de for displaying results
## and use a proper message catalog for `de'.

Lang ja_JP.SJIS


##
## Scoring: Set the scoring method "tfidf" or "simple".

Scoring tfidf


##
## EmphasisTags: Set the pair of html elements which is used in
## keyword emphasizing for search results.

EmphasisTags "<strong class=\"keyword\">" "</strong>"

##
## MaxHit: Set the maximum number of documents which can be
## handled in query operation. If documents matching a
## query exceed the value, they will be ignored.

MaxHit 10000

##
## MaxMatch: Set the maximum number of words which can be
## handled in regex/prefix/inside/suffix query. If documents
## matching a query exceed the value, they will be ignored.

MaxMatch 1000

##
## ContentType: Set "Content-Type" header output. If you want to
## use non-HTML template files, set it suitably.
#ContentType "text/x-hdml
"


-------------------------------------------------------------
編集後、後述のとおり、namazuricを自分のホームページのフォルダにアップロードする。

7.私のディレクトリ構造
ここで以下の話をわかりやすく進める前に私のホームアドレスとパソコンならびにWeb上のディレクトリを図示しておきます。なお、msearch152はmsearchエンジンのことではなく私が勝手に作ったフォルダでこのフォルダの中に私がインデックス化したいTable1〜Table50のファイルが納めてある。正確にはC:\msearch152\drugstore(パソコン内)あるいは/msearch152/drugstore(Web上)のようにdrugstoreのディレクトリの中に納めてある。検索すべきディレクトリ(又はホルダー)はこのように同じレベルにしておく必要がある。



8.インデックスを作りたいファイルの移管(私の場合はmsearch152)
私のホームページの各種ファイルはデスクトップに置いています。この中で、私が検索したいフォルダmseach152が存在します。インデックスを作るときは、このデストップ上のmsearch152をC:にコピーする。

9.pnamazuの導入
1)pnamazuのダウンロード・インストール
プロバイダのホームページでPerl版を使いたい場合は以下のリンク(Perl版の作者古川令さんのページ)からダウンロードして下さい。
 → pnamazuの入手先(pnamazu-2006.12.23) 。pnamazu-2006.12.23.クリックし、ダウンロード、解凍保存され、pnamazu.cgiの入ったフォルダ:最新バージョンpnamazu-2006.12.23がデスクトップにできる。

2)pnamazu.cgiの名前の変更と内容の確認
このフォルダの中にある名前を「pnamazu.cgi」から「namazu.cgi」に変更して下さい。
、名前を変更した「namazu.cgi」をエディタ(私はTeraPadを使用)で開き、Perlのパスをサーバーに合わせて、「#!usr/local/bin/perl」、「#!usr/bin/perl」などのように書き換えます。ちなみに、私はロリポップのサーバーをつかっており、/usr/local/bin/perl もしくは /usr/bin/perl のどちらでも良いことになってます。
このnamazu.cgiをエディタで開くと以下のような内容になっており、このまま、上で作ったWeb用フォルダ(Webfile)の中に保存しておく。

3)アップロードとパーミッションの変更
書き換えが終了したらサーバーの指定するCGIが使えるサイトにアップロードします。アップロードの方法とパーミッションの変更については後述の
「ホームぺージを置いているWebサイトへのFTPでのアップ作業」を参照。
#!/usr/bin/perl
$SCRIPT_NAME='';
## cgiwrap のために「次の xx 件」が表示できないときに、
## CGI の絶対パスを設定して下さい。
## 例えば、http://www.xxx.yyy/zzz/namazu.cgi だったら
## $SCRIPT_NAME='/zzz/namazu.cgi';
## のように
{my($tmp)=$0;$tmp="./$tmp" if -e $tmp && $tmp !~ /[\/\\]/;while ($tmp =~ /^(.*[\/\\])/){unshift(@INC, $1);last if !-l $tmp;$tmp=$1 . $tmp if ($tmp=readlink($tmp)) !~ /^\//;}}
$Debug=1 if -e "debug";
sub config{$Pnamazu = '2006.12.23';
$Author='furukawa@tcp-ip.or.jp';
$...

以下略す
 
これで「namazu」を使用できる環境ができました。

10.インデックスの作成
1)MS−DOS手動入力インデックス作成
「namzu」を使うにはインデックスを作成する必要があります。
MS-DOSプロンプトから立ち上げ次のように入力して下さい。
mknmz -O c:\namazu\var\namazu\index c:\**: ※c:\***はあなたがインデックスを作りたいディレクトリです。あなたがC:\以下にインデックスを作りたいファイルを格納されているのでしたら、私のように mknmz -O C: \namazu\var\namazu\index C:\msearch152などのように指定して下さい

以下のように出れば成功です。
C:\>C:\namazu\bin\mknmz --html-split -O C:\namazu\var\namazu\index C:\msearch152

検索対象のファイルを調べています...
174個のファイルがインデックス作成の対象として見つかりました
1/174 - /C|/msearch152/drugstore/Table1.htm# [text/html]
1/150 - /C|/msearch152/drugstore/Table1.htm#1 [text/html]
2/150 - /C|/msearch152/drugstore/Table1.htm#2 [text/html]
3/150 - /C|/msearch152/drugstore/Table1.htm#3 [text/html]
4/150 - /C|/msearch152/drugstore/Table1.htm#4 [text/html]
5/150 - /C|/msearch152/drugstore/Table1.htm#5 [text/html]
以下略

※ここが間違いやすい! 
2回目以降のインデックス作成時に注意すべきこと!!。
一度インデックスを作成すると10−2)のごとくC:\namazu\var\namazu\index の中に64個のファイルができ、このままの状態で2回目のインデックスを作成しょうとすると以下のように「ファイルは削除されています」とか「インデックスすべきファイルはありません」というメニューがでたり、全くなんにも出ない場合もあります。従って、まずこれらのC:\namazu\var\namazu\index内にできたすべてのファイルを削除してから、インデックスを作成しましょう。

-----------------------------------------------------------
注意:インデックス作成時は必ず、C:\namazu\var\namazu\indexのiindex内のファイルを全て削除してから、 C:\>C:\namazu\bin\mknmz --html-split -O C:\namazu\var\namazu\indexと入力すること。

※ここが間違いやすい! namazu\bin\mknmz --html-split -OのOは数字の0ではありません。ローマ字の大文字Oです。私もだいぶ間違えました、数字の0とローマ字の大文字O、見分けがつきにくいです。!

(1)もし上記の画面が出ないで、すぐMS-DOS画面が消えるようなら、インデックスができるファイルに何らかのファイルが残っていると考えられるので、C:\namazu\var\namazu\indexのiindex内のファイルを全て削除してから再度、 以下を入力する。
C:\>C:\namazu\bin\mknmz --html-split -O C:\namazu\var\namazu\index C:\msearch152

(2)エラーが出たとき
Can't locate File/MMagic.pm in @INC(@INC contains : . C:/Perl/lib
C:/Perl/site/lib :) at C:NAMAZU\BIN\MKNMZ.BAT line 46.
BEGIN failed-compilation aborted at C:NAMAZU\BIN\MKNMZ.BAT line 46
あるいは
Can't locate NKF.pm in @INC (@INC contains: /usr/local/share/namazu/filter /usr/local/share/namazu/pl .
/usr/local/lib/perl5/site_perl/5.8.7/mach
などが出たときは恐らく、ここで示したnamazuとちがうバージョンのものをダウンロードされたものと思われます。
再度namazuをNamazu 2.0.14 for Win32 β版 (2004-12-15)  http://namazu.org/~takesako/pub/nmz2014beta.exe

に入れ直してチャレンジしてください。その際、苦労して書き直したnamazuricやmknmzrcのファイル(C:\namazu\etc\namazuのフォルダの中にある)はそのままデスクトップにコピーして保存しておき新しくダウンロードしたファイルと置き換えてください。

(3)perl-V, kakasi -h, mknmz, mknmz --helpがうまく起動し、mknmz -CやC:\namazu\bin\mknmz --html-split -O C:\namazu\var\namazu\index C:\msearch152が走らず上の(2)のようなメニューが出たときもnamazuをNamazu 2.0.14 for Win32 β版 (2004-12-15)  http://namazu.org/~takesako/pub/nmz2014beta.exe

に入れ替えると恐らくうまくいくはずである。
--------------------------------------------------------------
2)MS−DOS全自動入力インデックス作成
しかし、MSーDOSを立ち上げC:\>mknmz -O C:\namazu\var\namazu\index C:\msearch152を毎度、入力するのは面倒なのでバッチファイルをつくります。
テキストエディタのTera Padで開き以下のコマンドプロンプトを記入し、BATファイル(*.bat)として保存する(私の場合はmake_index.bat)。すると歯車みたいなファイルができあがる。
しかし、図のようにファイル名に(.bat)が表示されない。ファイルの保存場所はローカルディスク(C:)に保存します。
C:\>C:\namazu\bin\mknmz --html-split -O C:\namazu\var\namazu\index C:\msearch152

インデックスを作成したディレクトリ C:\namazu\var\namazu\indexを見てみましょう。合計64個のファイルが生成されているはずです。

NMZ.body
NMZ.body.es
NMZ.body.fr
NMZ.body.ja
NMZ.field.date
NMZ.field.date.i
NMZ.field.from
NMZ.field.from.i
NMZ.field.message-id
NMZ.field.message-id.i
NMZ.field.newsgroups
NMZ.field.newsgroups.i
NMZ.field.size
NMZ.field.size.i
NMZ.field.subject
NMZ.field.subject.i
NMZ.field.summary
NMZ.field.summary.i
NMZ.field.to
NMZ.field.to.i
NMZ.field.uri
NMZ.field.uri.i
NMZ.foot
NMZ.foot.es
NMZ.foot.fr
NMZ.foot.ja
NMZ.head
NMZ.head.es
NMZ.head.fr
NMZ.head.ja
NMZ.i
NMZ.ii
NMZ.log
NMZ.p
NMZ.pi
NMZ.r
NMZ.result.normal
NMZ.result.normal.es
NMZ.result.normal.fr
NMZ.result.normal.ja
NMZ.result.short
NMZ.result.short.es
NMZ.result.short.fr
NMZ.result.short.ja
NMZ.slog
NMZ.status
NMZ.t
NMZ.tips
NMZ.tips.es
NMZ.tips.fr
NMZ.tips.ja
NMZ.version
NMZ.w
NMZ.wi
NMZ.bodyは検索画面を表示する際のtemplateの本体部分です。NMZ.bodyが英語、esはスペイン語、frはフランス語、jaは日本語でHTMLが記述されています。

NMZ.footは検索画面を表示するtemplateの末尾の部分です。

NMZ.headは検索画面を表示するtemplateの先頭の部分です。

NMZ.result.normalは検索で見つかったファイルを表示する際に使用するtemplateです。

NMZ.result.shortは検索で見つかったファイルを表示する際に使用するtemplateです。normalの簡易表示版です。

NMZ.tipsは検索方法を説明した文書が格納されています。

NMZ.wはインデックス化された単語が登録されています。
上記のファイルの中身はいずれもテキストファイルです。テキストエディタで開けます。

インデックスが作成できたら、MS-DOSプロンプトでnamazuコマンドを使って実際に文書を検索してみましょう。namazuコマンドに続いて、検索したいキーワード、インデックスを保存したディレクトリを指定します。以下のように出れば成功です。ここではアドレスは/cl/のようになります。
C:\>namazu 水虫 c:\namazu\var\namazu\index
検索結果

参考ヒット数: [ 水虫: 2 ]

検索式にマッチする 2 個の文書が見つかりました。

1. Q&A本文(No1-150) (スコア: 7)
著者: 不明
日付: Sun, 02 Dec 2007 07:59:31
HP内検索エンジン トップページヘ Q&A本文(No001-150) No Q(お客の質問) A(答え) 1 水
虫を治療する要点 1.じゅくじゅくタイプの水虫には軟膏、クリーム、ジェル、かさかさ
タイプにはしみこむ力が強い液剤。2.風呂
/c|/msearch152/drugstore/Table1.htm (90,998 bytes)



2. Q&A本文(No151-300) (スコア: 4)
著者: 不明
日付: Sun, 02 Dec 2007 07:59:52
HP内検索エンジン トップページヘ Q&A本文(No151-300) No Q(お客の質問) A(答え) 151

11.ホームぺージを置いているWebサイト(サーバー)への
   FTPでのアップ作業

FTPツールを起動し、自分のホームページのフォルダ(私の場合はhttp://biwa28.lolipop.jp/)の中にnamazu関連のファイルを格納するフォルダを作成します。私はcgi-binというフォルダを作成し、その中に以下のものを格納しました(既述の「私のディレクトリ構造」を参照)。 

1)アップロード
web上のcgi-binのフォルダーに以下のファイルをアップロードする。
@「namazu.cgi」(C:Web_namazu起動用フォルダー内ものをアップロード)。
AC:Web_namazu起動用フォルダー内のnamazurcをアップロード。
以下のようにアップロード用のFTPを立ち上げ、サーバーに接続し、サーバー側にcgi-binというホルダーを作る。

ついでパソコン側のweb-namazu起動用フォルダーをクリックすると次のような画面がでる。

ついでサーバー側のcgi-binフォルダーをクリックする。

ついでパソコン側のnamazu,cgiとnamazurcの2つのファイルをサーバー側へアップロードする。


Bパソコン内で予めインデックス化されたC:\namazu\var\namazu\indexにある64個のファイル
上と同じ方法でパソコン側からサーバー側へ64個のファイルをアップロードする。
2)パーミッションの変
アップロード後、cgi-binのフォルダのパーミッションを「755」に、namazu.cgiのファイルのパーミッションを「755」に変更して下さい(この変更は重要です、変更しないと動きません)。


パーミッションの変更方法:パーミッションの変更は、FTPソフトで行うことができます。 下のようなFTPソフトを例に説明すると、次のような流れになります。 (1) アップロードしたファイルの中から、パーミッションを変更したいファイル(またはディレクトリ)を右クリックする。 (2) 右クリックして出てきたメニューの中から「属性変更(A)をクリックする。 (3) 3桁の数字が入力されている部分があるので、そこに新しいパーミッションの数字を入力する。 (4) 書き換えが終わったら、「OK」ボタンを押して変更完了です。



cgi-binのフォルダへアップするのはC:Web_namazu起動用フォルダー内(namazu.cgi、namazurc)と「インデックス化されたC:\namazu\var\namazu\indexにある64個のファイル」だけです。perl、kakasiやmknmzrcやその他のnamazuのフォルダやファイルを送る必要はありません。


12. ホームページへの検索窓の設置

Webページへnamazuの検索窓を設置する場合、通常のnamazu検索画面の様な配置では場所をとるため、簡易的な検索にならざるをえません。以下の赤字の3カ所をご自分のホームページにあったように修正する。
修正後、ご自分のホームページの中の検索窓をつけたい箇所に<bodyから</form>までのHTMLソースを貼り付け、貼り付けたページをWebにアップする。

<BODY <!--Namazu による全文検索システム-->
<form action="
http://biwa28.lolipop.jp/cgi-bin/namazu.cgi" method="get">
<p>
<a href="http://www.namazu.org/"><strong>Namazu:</strong></a>
<input               name="query"    size="30" accessKey="T" tabIndex="10">
<input type="hidden" name="whence"  value="0">
<input type="hidden" name="max"     value="20">
<input type="hidden" name="result"  value="normal">
<input type="hidden" name="sort"    value="score">
<input type="hidden" name="
msearch152" value="pub">
<INPUT type="submit" value="検索" accessKeyS" tabindex="11">
[<a href="
http://biwa28.lolipop.jp/cgi-bin/namazu.cgi">説明</a>]
</p>

</form>

</form>

プレビューすると以下のような画面がでる

Namazu: [説明]


13.ホームページ上での検索
ホームページ上で検索窓に検索単語を入れると瞬時に以下のような画面がでる。


Namazu による全文検索システム

現在、 2 の文書がインデックス化され、 5,510 個のキーワードが登録されています。

インデックスの最終更新日: 2008-03-27


検索式: [検索方法]

表示件数: 表示形式: ソート:

検索結果:

参考ヒット数:

  • [ 水虫: 2 ]

検索式にマッチする 2 個の項目が見つかりました。

1. Q&A本文(No151-300) (スコア: 1)
著者: 不明
日付: Sun, 02 Dec 2007 07:59:52
HP内検索エンジン トップページヘ Q&A本文(No151-300) No Q(お客の質問) A(答え) 151 血圧は毎日何時頃、測ればよいか 血圧は日内変動があり朝起きたときは低く、日中は高くなり夜に向かって低くなります。従って
http://biwa28.lolipop.jp/msearch152/drugstore/Table1a.htm (102853 bytes)

2. Q&A本文(No1-150) (スコア: 1)
著者: 不明
日付: Sun, 02 Dec 2007 07:59:31
HP内検索エンジン トップページヘ Q&A本文(No001-150) No Q(お客の質問) A(答え) 1 水虫を治療する要点 1.じゅくじゅくタイプの水虫には軟膏、クリーム、ジェル、かさかさタイプにはしみこむ力が強い液剤。2.風呂
http://biwa28.lolipop.jp/msearch152/drugstore/Table1.htm (90998 bytes)
14.インデックスの更新
1)C:にあるインデックスを作りたいファイルに入れ替え:

私の場合はmsearch152がインデックスを作りたいファイルである。
(1)C:にあるmsearch152を削除する。
(2)デスクトップに保管している新たにインデックスをつくりたいmsearch152をコピーして,C:に貼り付ける。

2)前回作成したインデックスを保管してあるファイル64個すべてを削除:
私の場合は、C:\namazu\var\namazu\indexの中にある。これを削除しておかないとインデックスを作るプログラムが走らない。

3)インデックスの作成:
MSーDOSを立ち上げC:\>mknmz -O C:\namazu\var\namazu\index C:\msearch152(10-1参照)と入力するか、あるいはMS−DOS全自動入力インデックス(バッチファイル)(10-2参照)を起動する。
(1)インデックス作成のためのMS-DOSが走る。
(2)\index内に新たにインデックスが作成される。

4)サーバー上のインデックス用ファイル64個の削除:
前回サーバーに送ったインデックス用ファイルをサーバーから削除する。
FTPでサーバーにつないだ後、フォルダ内(私の場合、cgi-binの中にある)から、プログラムファイル「namazu.cgi」と「namazurc」の2つのファイルはそのままにし、それ以外のすべてのファイル64個を削除する。

5)インデックス用ファイルのサーバーへの転送:
パソコン内の10.でできたインデックスファイル全てをサーバー内のフォルダ(私の場合はcgi-bin)へ転送する。

6)完了:
Web上で、namazu検索が可能になる。

15.バージョンアップの方法(namazu2.0.14→2.0.18 windows版)
Namazu 2.0.14 for Win32 β版→Namazu for Windows 2.0.18 ( アーカイブ001 )への変更。
namazuのver2.0.14からver2.0.18にバージョンアップする方法は簡単です。
ver2.0.18をダウンロードし、このファイル中のnamzuのフォルダ毎、コピーし、C:にあるnamazuのフォルダに貼り付けるだけでよいです。
Namazu 2.0.14 for Win32 β版のnamazuのファイル(C:namazu/etc/namazu/)
中にあるmknmzrc や
namazurcが書き変えられると、起動しませんが新たに導入するNamazu for Windows 2.0.18には同じファイル名がないので、書き換えられずそのまま残ります(もし、同じファイル名がver2.0.18のファイルにあればver2.0.14の中のmknmzrc やnamazurcを予め別の所に保存しておいて、コピペの後、この2つのファイルを貼り付ける。ver2.0.18のnamazu/etc/namazu/のファイル中にはmknmzrc-sample、mknmzrc-sample.win32、namazurc-sample、namazurc-sample.win32の4つのファイルしかないと思いますのでこの作業は必要ないと思います)。
これ以外の設定は全く変更する必要はありません。

もし、インデックスを作る操作で、うまく走らない場合、var/namazu/index/の中に以前作ったファイルが残ってないか確認してください。残っていたら、全てを削除してください。さらにそれでもうまくいかない場合は
「16.namazuが突然indexの更新ができなくなった時の対応」も参照してください。

16.namazuが突然indexの更新ができなくなった時の対応
1)ウイルスソフトが妨害
結論からいうと、2009.10.10にノートンアンティウイルス2010をパソコンに入れてから、動かなくなったことに気づいた(無料ソフト:キングソフトのアンティウイルスhttp://www.kingsoft.jp/is/antivirus.htmlは影響を受けない)。
ノートンアンティウイルスを開き、ONになっている項目(インサイト保護、ウイルス対策、スパイウエア対策、sonar保護、進入防止、電子メール保護、プラウザ保護、ダウンロードインテリジェンスの
8つ)すべてをOFFにすると、インデックスが今まで通り起動した。なお、OFFにしておく時間を1時間以上に設定すること。
15分だとインデックスの作成処理中にカタンと止まってしまうので注意のこと。また、インターネット再開の時は必ずONにすること。FTPツール起動の時もONにすること。
2)index中(c:\namazu\var\namazu\index )の以前に作成したファイル64個が残ってないか?
indexの作成に当たってはindex中のすでに作成した64個のファイル全てを削除してからでないと、indexの更新ができない。
3)perlのバージョンがnamazuのバージョンに対応しているか?(17の2)を参照)。
perlを対応するものに(相性がよいもの)に入れ替える。
4)pathの確認
システム環境変数を開き PATHにPerlのパスが書き込まれていることを確認(ActivePerlのインスツール後の確認事項を参照)。
その他、以下PATHにkakasiやnamazulのパスが書き込まれていることを確認する。
kakasiのpath(kakasiのインスツール後の確認事項を参照)。
namazuのpath(namazuのインスツール後の確認事項を参照)。
5)長年namazuを使っていて、調子が悪くなったとき。たとえばPerl -vkakasi -hが上手く起動する。しかし、namazu --helpmknmz -help, mknmz -Cが上手く起動しない場合の対処方法




17.バージョンアップの方法.
(namazu2.0.18→2.0.20 windows版→2.0.21 windows版
Namazu for Windows 2.0.20 (アーカイブ001)が2009-09-23:に公開された。できるだけ速く、今までのバージョンから2.0.20へのバージョンアップを勧めているので挑戦した。
namazuとperlをダウンロードする。
1)まずnamazu2.0.20をダウンロードし、このファイル中のnamzuのフォルダ毎、コピーし、C:にあるnamazuのフォルダに貼り付けるだけでよいです。
nmz2.0.20.001-win32.zip のnamazuのファイル(C:namazu/etc/namazu/)
中にあるmknmzrc やnamazurcが書き変えられると、起動しませんが新たに導入するNamazu for Windows 2.0.20には同じファイル名がないので、書き換えられずそのまま残ります(もし、同じファイル名がver2.0.20のファイルにあればver2.0.18の中のmknmzrc やnamazurcを予め別の所に保存しておいて、コピペの後、この2つのファイルを貼り付ける。ver2.0.20のnamazu/etc/namazu/のファイル中にはmknmzrc-sample、mknmzrc-sample.win32、namazurc-sample、namazurc-sample.win32の4つのファイルしかないと思いますのでこの作業は必要ないと思います)。
2)ついでperlのバージョンが5.6.1.633以前のものであれば古くて起動しないかもしれないのでバージョン5.6.1.633以降のものに置き換える。
これ以外の設定は全く変更する必要はありません。

3)ついでperlとwindowsのpathがあるかどうかを確認する。
コントロールパネル→パーホーマンスとメンテナンス(クラシック表示の場合は直接システムを選択)→システム→詳細設定→環境変数タブ→システム環境変数を開き PATHにPerlのパスが書き込まれていることを確認。書き込まれていなければ、下段のシステム環境変数の編集タブをクリックして「編集」をクリックして書き込む。変数名に「Path」、変数値に「C:\perl\bin;%Path%;」と入力する。PATHにC:\:windows;がなければこれも続けて書き込む。→C:\perl\bin;%Path%;C:\:windows;

※ここが間違いやすい!「C:\perl\bin;%Path%;」は「C:¥perl¥bin%Path%」です。binと%の間とPath%の後ろに「;」(セミコロン)を入れる。
 MS-DOSプロンプトを立ち上げ、「perl -v」と入力。画面が以下のように表示されればインストール完了です。

This is perl, v5.6.1 built for MSWin32-x86-multi-thread
(with 1 registered patch, see perl -V for more detail)

Copyright 1987-2001, Larry Wall

Binary build 633 provided by ActiveState Corp. http://www.ActiveState.com
Built 21:33:05 Jun 17 2002


Perl may be copied only under the terms of either the Artistic License or t
GNU General Public License, which may be found in the Perl 5 source kit.

Complete documentation for Perl, including FAQ lists, should be found on
this system using `man perl' or `perldoc perl'. If you have access to the
Internet, point your browser at http://www.perl.com/, the Perl Home Page.

※MS-DOSプロンプトは、スタート→すべてのプログラム→アクセサリ→コマンドプロンプトをダブルクリックしてで開きます。

もし、インデックスを作る操作で、うまく走らない場合、var/namazu/index/の中に以前作ったファイルが残ってないか確認してください。残っていたら、全てを削除して再度インデックスをつくってください(2009.12.15追記)。さらにそれでもうまくいかない場合は「16.namazuが突然indexの更新ができなくなった時の対応」も参照してください。
2.0.21windowsへのバージョンアップも同様です。
namazu2.0.20 windows:http://www.akaneiro.jp/public/nmz2.0.20.001-win32.zip
namazu2.0.21 windows:http://www.akaneiro.jp/public/nmz2.0.21.001-win32.zip

perl:http://downloads.activestate.com/ActivePerl/Windows/5.6/ActivePerl-5.6.1.633-MSWin32-x86.msi
                                                           
18.
完全自動化(インデックス作成とサーバーへの転送)

コマンドプロンプト(MS-DOS)を使って、インデックスを自動的につくる方法について述べる。
@ローカルディスク(C:)のnamazuファイル中のindexファイルの削除
インデックスを作るためには以前に作ったC:\namazu\var\namazu\indexのindex内にあるファイルを削除しなければならない。
Aホームページ内のインデックスをつくりたいファイルをローカルディスク(C:)へコピー
デスクトップ上にある作成・保存されたファイル(私の場合C:\Documents and Settings\Owner\デスクトップ\ホームページ新規\ドラッグストアQAロボ\msearch152)をローカルディスク(C:)へのコピー。
B新規インデックスの作成
ローカルディスク(C:)のnamazuファイル中のindexファイル内に新規インデックスの作成する。
以下の方法でバッチファイルをつくってからwindowsのタスク機能をつかうと自分の決めた時刻に作業を自動的にさせることができる。1)でバッチファイルをつくる方法について、2)でタスク機能の設定の方法について述べる。

Cインデックスをアップロード

1)インデックスの作成(@からBの完全自動化のためバッチファイルを作る)
@ローカルディスク(C:)のnamazuファイル中のindexファイルの削除
テキストエディタのTera Padで開き以下のコマンドプロンプトを記入し、BATファイル(*:bat)として保存する(私の場合はdel_sakujyo.bat)。すると歯車みたいなファイルができあがる。

del C:\namazu\var\namazu\index\NMZ.*
rmdir /S /Q C:\msearch152

Aホームページ内のインデックスをつくりたいホルダーをローカルディスク(C:)へコピー
私のホームページの作成・保存場所はデスクトップにある。作成・保存場所はコマンドプロンプトで表示するとC:\Documents and Settings\Owner\デスクトップ\ホームページ新規\ドラッグストアQAロボ\msearch152となる。
このmsearch152のファルダ内の全てををローカルディスク(C:)へコピーしたいのだが、このコマンドプロンプトをつくって走らすのに大変苦労した。ローカルディスクでなくデスクトップにコピーされたり、msearch152のフォルダの中にはさらにフォルダやファイルがあるのにファイルだけしかコピーできないとか素人の私解決できず、Yahoo Japan 知恵袋に公開質問し教えてもらった(http://chiebukuro.yahoo.co.jp/)。
コピー元とコピー先のホルダーの場所を" "で囲むこと。『/y』 が強制上書き、『/e』は、コピー元のディレクトリ(フォルダ)もコピーするコマンドなどを教えてもらった。テキストエディタのTera Padで以下のコマンドプロンプトを記入しBATファイル(*:bat)として、copype.batとして保存した。
xcopy "C:\Documents and Settings\Owner\デスクトップ\ホームページ新規\ドラッグストアQAロボ\msearch152" "c:\msearch152\:" /y/e

B新規インデックスの作成
新規のインデックス作成は以前に述べた10の2)MS−DOS全自動入力インデックス作成の項で述べた以下の内容が記入されたバッチファイル(make_index.bat)を利用する。
C:\namazu\bin\mknmz --html-split -O C:\namazu\var\namazu\index C:\msearch152

C自動化
@〜Bの作業をそれぞれバッチファイルをクリックすればこれぞれ走るのだが@〜Bをまとめて一瞬に作業をさせるためにテキストエディタのTera Padで上記の@〜Bのコマンドプロンプトをまとめて記入しBATファイル(*:bat)として、make_index.batとしてすでにあるmake_index.batに上書き保存した。
del C:\namazu\var\del C:\namazu\var\namazu\index\NMZ.*
rmdir /S /Q C:\msearch152
xcopy "C:\Documents and Settings\Owner\デスクトップ\ホームページ新規\ドラッグストアQAロボ\msearch152" "c:\msearch152\:" /y/e
C:\namazu\bin\mknmz --html-split -O C:\namazu\var\namazu\index C:\msearch152

2)インデックス作成を完全自動化(タスク機能:batファイルを自動的に定時刻に起動)
上記18)−Cのバッチファイル(インデックスの削除、ホームページ内のインデックスをつくりたいホルダーをローカルディスク(C:)へコピー、インデックス新規作成)を指定した時間、または起動時に実行を完全に自動化させることができます。
Windows7(他のOSでも同様の機能あり)の「タスク」は使い方によってとても便利な機能です。

以下、設定方法をご紹介します。
namazuのindexスケジューラーの設定(毎日12時に自動的に起動させる)

(1). 以下に従ってコントロールぱネルを開く(windows7)。
(2). 画面の右端からスワイプし、[設定] をタップします。
(マウスを使っている場合は、画面の右下隅をポイントしてマウス ポインターを上へ移動し、[設定]をクリックします。)


(3). [コントロールパネル]をタップする。


(4). システムとセキュリティを選択

(5). 管理ツールの中のタスクスケジューラーを選択

(6). 基本タスクの作成
右端の基本タスクの作成を選択


(7). タスクの名前を記入後、次へ

(8). タスクトリガー→毎日を選択、次へ


(9). 時刻の選択(仮に毎日12時に起動させるなら」トリガーを12:00:00に設定する)。


(10). 操作の選択


(11). プログラムの選択参照をクリックしタスクしたいプログラムを選択する。
 C:\に保存したmake_index.batを指定する。

  
(12). タイムスケジュールを変更したいとき→左端のタスクスケジューラーライブラリ
を選択。

13.全般の項目で以下の2つを選択する。


参考
設定時刻の変更方法(タスクの時間の変更

1)コントロールパネルを開く。下段のタスクノスケジュールを選択。

2)タスクスケジューラーを選択。

3)上段の中から目的のタスクをダブルクリック

(4)トリガーを選択し矢印をダブルクリック。

(5)この画面で時刻を修正する。


3)作成インデックスのサーバーへの自動アップロード(定時に起動)

14の4)、5)の作業を以下のソフトで自動化する.
1無料ソフトのダウンロード
自動でアップロードできるソフト(DT-FTP)をダウンロードする。
DT-FTPダウンロードサイトhttp://biwa28.lolipop.jp/dt_ftp108.zip

2.DT-FTPの設定方法

 起動させると次のような画面が出てきます.

@転送先サーバーの設定

転送先のサーバーです。各自が用意したサーバーへの転送設定をここへ入れてください。
Host name:FTPホスト(サーバー)名
HOST DIR
:アップ先フォルダ
User ID:FTPユーザー(アカウント)名
Password:FTPパスワード

A転送元のフォルダ

つまり,HROFFTが入っているフォルダです。path1path2も同じにしてください。

B転送後の移動フォルダ

必ず作成してください。自動ftp後,データを移動するフォルダです。このDT-FTPは,そのフォルダ内にある,ファイルをすべて更新します。つまり,前回FTPしてもまたFTPします。ですから,更新したデータは別フォルダへ移動させます。移動先のフォルダを作成して指定してください。

CFTPの時間間隔

何分おきにFTPするか。です。これは,適当に設定してください。ここで設定すると画面上側のところにNext FTP Transfer として時刻で表示されます。前ページの場合は現時刻(System Time)16:54:57JSTで,次の更新時刻が17:04:00JSTということになります。

D転送するファイルの種類

PNGを生成するHROFFTを使っている人が大多数だと思いますので,ここは,「*.png」と書き込みます。ふたつありますが,まぁ何も考えずふたつとも同じにしておきましょう。都合によりGIF版をお使いの方は「*.gif」にしてください。

E更新対象ファイルリスト

更新するファイルのリストがでます。

FFTP後の動作設定

元のファイルをアップ後そのまま残すなら Nothing to doを選択。

G動作時間

上のFullで。

Hタイムサーバ設定

ここは触る必要ありません.SNTPにチェックが入っていないことを確認しておいてください.

3. DT-FTPを自分のパソコン上で設定

1.まず1を押すと2の画面が出るので上記2の手順にのっとり設定する。

22回目以降の設定で以下の画面が出ると時は

3)デスクトップの右下段の(矢印)を押すとSetupまたはQuitを聞いてくる。

のでSetupを押すと1)の設定画面が出る。

4)DT-FTPが起動しアップロードすると右下段のが黄色く反転し画像のようになる。


以上で「DT-FTP」を使った一発ホームページデータ更新転送術の伝授は完了です。

DT-FTP」のような素晴らしいソフトをフリーで公開してくださった小川 宏様にこの場を借りて厚く御礼申し上げます。


19.アクシデント
namazuの設置で今までに大きく3回のアクシデントがあった。ひとつはダウンロードの順番を間違えたこと。2つめはノートンのセキュリティソフトがnamzuの起動を阻止したこと。3つ目は転送ソフトのFTPソフトがうまく起動しなかったことです。

1)アクシデント1
Active perl →kakasi→namazuの順にダウンロードすべきなのにそうしなかった。

2)アクシデント2
ノートンのセキュリティソフトがインッデックスを作成中に途中で起動ソフトがカタンと止まった(参照16−1)。

3)アクシデント3
転送ソフトがうまく起動しなかった。
次の項目すべてが問題なくできあがり、サーバーへ送って検索をすると以下のように検索結果がゼロとなり何度やっても同じであった。下の1から8までの操作を何度、繰り返しチャレンジしてみてもうまく検索できなかったがFTP転送ソフトを変えることで検索できやっと解決した(2012.03.23)。

1.C:\>perl -v  正常に起動
2.C:\>kakasi -h 正常に起動
3.C:\>perl -v  正常に起動
4.C:\>mknmzも C:\>namazu --helpも正常に起動
5.C:\>mknmz -C 正常に起動
6.C:\>C:\namazu\bin\mknmz --html-split -O C:\namazu\var\namazu\index C:\msearch152
  C:namazu/var/namazu/indexのファイルの中に64個のファイルができているのを確認

7.MSDOSで検索できることを確認
C:\>namazu 水虫 c:\namazu\var\namazu\index
検索結果

参考ヒット数: [ 水虫: 2 ]

検索式にマッチする 2 個の文書が見つかりました。

1. Q&A本文(No1-150) (スコア: 7)
著者: 不明
日付: Sun, 02 Dec 2007 07:59:31
8..サーバーへnamazu.cgi, web内起動用namazurcおよびパソコン内で作成したインデックスが格納された64個のファイルをアップ。
以下のようにホームページで検索すると結果がゼロでどこが悪いのかを突き止めるまで1週間以上かかった。
Namazu による全文検索システム

現在、 2 の文書がインデックス化され、 5,510 個のキーワードが登録されています。

インデックスの最終更新日: 2008-03-27


検索式: [検索方法]

表示件数: 表示形式: ソート:

検索結果:

参考ヒット数:

  • [ 水虫: 0 ]

検索式にマッチする 0個の項目が見つかりました。


9.結論はファイル転送ソフトが駄目だったようです。今までホームページビルダーv6.5付属の転送ソフトを利用していたのですがこれが何かの理由で壊れていたようです。

siriasu.s.netのFTPを利用することで検索機能がうまく復活しました。

20.Windows XPからWindows8への乗り換えに伴うnamazu全文検索の引越方法

2014年4月にwindows xpのサポート期限が切れるとのことでコンピューターを買い換えwindows 8への引越作業に着手した。
1). .C:\ドライブにあるnamazu, perl, kakasiの引越
(1).Windows XPのC:¥にあるnamazu, perl, kakasiの3つのフォルダーをフラッシュメモリーかCD-ROMにコピーする。
(2).コピーしたフラッシュメモリー(またはCD-ROM)をWindows8につなぐ。
(3).フラッシュメモリーの中にあるnamazu, perl, kakasiの3つのフォルダーをWindows8のC:\ドライブに張り付ける。

2).環境変数の編集
(1)windows8のコントロールパネルを開く
(2)システムとセキュリティーをクリック。
(3)システムの中のリモートアクセスの許可をクリック。
(4)システムのプロパティの中の詳細設定をクリック。
(5)環境変数をクリック
(6)下段のシステム変数(S)の新規または編集をクリック。
以下の変数名と変数値を順次コピーする。書いてもいいが間違えるとうまくいかないのでそのままコピーして貼り付ける。

変数名 変数値 参考
PATH C:\namazu\bin;C:\kakasi\bin;%Path%;C:\bin;
C:\perl\bin;%Path%;
編集をクリックして左記の項目を追加する。すでに入っている項目の前に貼り付ける。
LANG ja_JP.SJIS 新規をクリックして左記の項目を入れる
KANWADICTPATH C:\kakasi\share\kakasi\kanwadict 同上
ITAIJIDICTPATH C:\kakasi\share\kakasi\itaijidict 同上
MKNMZRC C:\namazu\etc\namazu\mknmzrc 同上
NAMAZURC C:\namazu\etc\namazu\namazurc 同上
NAMAZULOCALEDIR C:\namazu\share\locale 同上
pkgdatadir C:\namazu\share\namazu 同上
HOME C:\namazu 同上

(7)システム変数の編集を終わりOKを押して閉じ、次いで環境変数をOKを押して閉じる。
(8)再起動をして、設定完了です

付録

1.参考資料
(私はnamazuとp-namazuを組み合わすことによって設置できました)
1)TKOーWEB(井上充生):Namazuの導入方法(私の備忘録として) Windows環境下における「pnamazu」のインストール方法 (あなたのサーバーに導入用)
2)FLnet:FLnetでの全文検索システムとPC内検索システムの構築について (NAMAZU for Win による)(FLnetサーバー利用時)
3)「鷹の巣」の自宅サーバー:全文検索システムNamazu(Windows用)の設定覚書(自宅サーバー用)
4)古川 令:namazu 検索プログラム perl 版 (pnamazu) 説明書
pnamazu-2006.12.23 by furukawa@tcp-ip.or.jp (あなたのサーバーに導入用)
5)馬場 肇著:NAMAZUシステムの構築と活用(2001.6.25初版)
6)Anabuki's Home Page:検索ソフトNamazuのインストール(http://anabuki.dip.jp/tips/namazu.htm)
2.私のパソコン環境
windows 8

基本ソフト
ホームページビルダー V6.5 V14
テキストエディター:TeraPad(tpad092.exe (681KB) :インストーラ付き )


3.私の利用レンタルサーバーロリポップ
ロリポップのサービスは以下の通りです。
HPアドレス(サブドメイン) http://アカウント名.
HPアドレス(独自ドメイン) http://お客様のドメイン
サブドメイン作成 独自ドメインプランの場合、容量内で 300件まで 作成できます。 
ディスク容量 50GM
ファイルマネージャー 利用可
HP簡単作成 利用可
ウェブログ 利用可
アクセス解析 利用可
CGI 利用可(オンラインマニュアル)
SSI 利用可(オンラインマニュアル)
PHP 利用可(オンラインマニュアル)
データベース MySQL が利用可
.htaccess 利用可(オンラインマニュアル)
商用利用 運営可能


4.私がnamazuを導入した理由
私はホームページを2002年に立ち上げました。内容は主として、私が管理薬剤師として日々、お客との対話の中での質疑応答をQ&A形式で表に追加しています。Q&Aのファイルは現在、約11,000(No1-No11,000)あまりになって、毎週更新しています。
Q&A本文の一つのファイルには150個のQ&Aが入っています。たとえばTable1というファイルにはNo1-No150のQ&Aを掲載しています。
このように、内容が膨大になりどこに何が入っているか私自身にも判断がつかなくなり、私のサイト内の検索をできないものかと思案しました。そこで最初に思いついたのがgoogleのサイト内検索DDIポケットでした。
しかし、googleは1〜2週間に1度しか私のホームページを検索に来ないし、こなければサイト内検索もできない。また私のホームページが膨大になるにつれて、ファイルの数もふえて全ファイルを一度に読んでくれなくなりました。
その後、無料サイト内検索の他、いろいろ試し最後に導入したのが「ホームページ内全文検索エンジンmsearch 」でした。インデックスを予めつくるので検索時間が早く、全ファイルを検索できました。最初は満足していました。しかし、msearchにも問題がでてきました。というのはmsearch(その他のエンジンも同様)は1ファイルのなかにいくつも同じ検索単語が含まれていた場合、ファイルの最初の方しか検索できません。たとえばTable1にはNo1からNo150のQ&Aがあり、No1とNo100にたとえば「塩酸エフェドリン」という言葉があってもNo1の方だけしか検索できません。
そこで何とか全部の検索単語を抽出できないものかと欲どおしいことを考え、探してました。いろいろ調べて引っかかってきたのがnamazu全文検索エンジンです。
ところが、このnamazuはもともとLinuxで導入されたもので私みたいな素人には縁遠いものでした。幸いなことにWindows版があり、これもいろいろなものがあることがわかりました。すなわち、1)パソコンのデスクトップ上で検索するもの、2)自宅サーバーを立ち上げそこに組みこむもの、3)自分の利用サーバーにアップするものに大きく分かれることがわかりました。
私がもくろむものは3)の方法が目的でした。
しかし、namazuの設定は難しく、今を遡ること6ヵ月間ほど試行錯誤を繰り返してきました。なかなかうまくいかずもうあきらめようかと思った時に、namazuを基本にこれを動かすCGIが公表されていることがわかりました。最初に出会ったのが「search-s for Namazu 0.9.2」でしたが、どうしてもうまくインデックスが作れず断念しました。最後の最後に出会い、夢のnamazuの完成に至ったのは井上充生さんの「Namazuの導入方法(備忘録) Windows環境下における「pnamazu」のインストール方法 」のおかげです。このホームページに出会わなかったら恐らく導入をあきらめていたでしょう。今日2008年3月20日はnamazuをやっと設置できた記念すべき日であり、執念で挑戦したこの6ヵ月の苦しみの後の、この喜びを忘れないための備忘録として、また私と同じレベルの方にもこの設置できる喜びを味わっていただくために設置方法をできるだけ詳細に記載することにしました。


後述
2008年3月20日記載の備忘録はperl, kakasi, namazuはそれぞれ単独(perl -v, kakasi -h, namazu --help, mknmz-C)では起動しましたが、最後のインデックスを作れなくて、再現性が無いことがわかました。
いろいろ試行錯誤して、上述のperl, kakasi, namazuのバージョン(Namazu 2.0.14)はうまく走り、インデックスも作成され、再現性があることがわかり、今までの記載を2008年11月7日に一部、変更しました。
記載に当たりまして、上述の参考文献を参考にさせていただきました。namazuがうまく起動したお礼とともに、参考文献の引用にあたり、一部はそのまま掲載させていただいたことを、Web上で、重ねてお礼申し上げます。 
なお、2008年12月4日にNamazu 2.0.14からNamazu 2.0.18へ、2009年12月15日にNamazu 2.0.18からNamazu 2.0.20へバージョンアップしたので、その方法を追加しました。2009年12月31日にはインデックス自動作成、作成されたインデックスが保管されたファイルのサーバーへの自動転送についての記述を追加しました。
2013年11月、コンピューターの買い替えに伴い、OSがWindows XP からWindows8に変更になり、namazu, kakasi, Perlをコピーし、それに伴い環境変数を書き換えた。

                                                2008.03.28/2008.11.07/2008.12.04/2009.12.15/2009.12.31,2011/06/19, 2012/03/23,2013/11/04