UTAHI.半魚文庫

[HOME 半魚文庫]

** JALLC TANOMOSHI No.1 **

[謡曲三百五十番集入力]

open 1998-11-3

謡曲三百五十番を機械可読テキストにしようとするプロジェクトです。フリーデータです。100人あつまれば、一人三番半いれるだけ!将来このデータを使いそうな人は、ぜひ参加しといてください。
つぎの文書をご覧ください。

  1. ダウンロード(一覧)

    謡曲253番が一通り入力し終わりました。重ねて、番外51番を開始しました。(2006-08-08)

    番外51番も一通り入力し終わりました。(2010-07-26)

    曲舞46番も一通り入力し終わりました。(2010-08-18)

  2. 入力の凡例、参加方法、著作権など(hanrei.txt)

      [概略]

    • 入力はほぼベタテキストです。凡例は細かいですが、おおむね直感的に理解可能だと思います。兎に角、本文を見てください。
    • 底本は、名著全集本『謡曲三百五十番集』と、赤尾照文堂版『謡曲二百五十番集』です(両者はほぼ同じものです)。著作権問題はクリアしています。
    • 参加は、底本が読めて(テキストを持っている等、読める環境にある)入力が出来る人なら、だれでも歓迎です。
    • 兎に角、細かいですが、凡例を見てください。

      [補足]

    • 目で分る翻刻のしかた(1999-02-15)
      • 底本の画像をつけました。見ただけで、直感的に翻刻出来るようにチュートリアル画像にしました。

  3. 配布条件(フリーデータです)

      [概略]

    • GNU準拠のフリーデータとして公開する予定ですが、完成までは転載(ほかのサーバからdownload出来るようにする)のは止めてください。いまは、入力者を募っている段階なので、とにかく、ここまでdownloadしにきてください。情報はすべてこちらで管理しています。
    • 現在既に入力されたデータは、downloadできます。必ず、凡例(./hanrei.txt)配布条件(./jgpl1.txt)を読んでください。また、人にあげる場合にも、これらのファイルを同梱し、このプロジェクトを宣伝してください。配布は無料配布が望ましく、実費以上の経費を取らぬようにしてください。
    • 現在のデータを持ってって勝手に利用するのは、勿論構いませんが、直接商売になるような利用はご遠慮願います。
    • 謡曲の本文には、人権に関わる用語の使用されているものがあります。資料的な性格から原本通りに入力しますが、利用者各位には人権問題の正しい理解に立って本テキストデータを活用してくださるようお願いします。

  4. このデータの主な使いみち

    本プロジェクトにご参加下さる方々におかれましては、御使用の意図はともあれ「意義がありそうだから参加する」という方も大勢居られ、大変有難く思っています。一方で、このデータはなんの役にたつのか?という質問も頂いたりしていますので、私なりの御説明をいたします。

    どのように使うかは、まさに人それぞれでしょうが、世話役の私としては次のような使い方を想定しています。

    1. GREP(グレップ)という文字列検索ソフトがあります。UNIXやDOSのコンソールから、またはWINDOWSやMACなどウィンドウ上で 起動します。秀丸エディタ内蔵のgrepも大変高機能です(シェアウェアですが4000円ですから安いです。学生なら只で使えます)。で、謡曲の中で、 「国土」という言葉が、どこに何回使われているか、などの用例検索に便利です。ひとくちにGREP と言っても、かなりの種類がフリーソフトで存在していて、自分に合ったものをVECTORデザインなどからダウンロードしてきて使うと良いでしょう。使い 方が分からない場合は、お申しつけください。ご相談にあがります(メールで)。

    2. もし、御要望が有れば、このページに、全文検索のエンジンを付けます。でも、アクセスも遅いし、GREP を覚えたほうがずっと便利ですよ。
    3. このデータを元にして、品詞分類の情報を付加したり、登場人物一覧を作ったり、段の構成の類型を採ったり、等、研究のための加工。

    逆に、次のような使用は、たぶん、不向きだと思います。

    1. ×謡曲の本文を、これで読む。
      中味を読むなら、コンピュータ画面やプリントアウトよりも、やっぱり冊子体です。注釈なんかがついている本がたくさんあります。ただ、ノートパソコンや携帯電話に入れてモバイル用とかにするのには役にたつでしょうか。
    2. ×このデータで、謡の稽古をする。
      節付けはついていません。このデータを加工して、節章を付けて、謡の稽古に使ったりすることも可能でしょうし、止めはしません。が、謡本をキチンと買ったほうが良いでしょう。本プロジェクトは、冊子の謡本の出版を疎外する意図は全くありません。

    なお、このデータをそのまま使って、『謡曲三百五十番集』を出版する等は、おやめ下さい。他人の翻刻本文をそのまま使って出版・販売するような人は居ないと思います。

  5. ご意見ご要望はこちら、メールでください。誤字情報もお寄せ下さい。

    (スパムメール対策として、画像でメールアドレスを示しています)

  6. 入力時に気付いた底本の誤植一覧(CSVファイル)

  7. おしらせ [更新履歴など]

    [2010-08-18] 253曲、番外51番、曲舞46番の入力が、ひととおり終りました。御協力、ありがとうございました。校正などはまだまだまだ完全ではありませんが。

    [2006-08-08] 253曲の入力が、ひととおり終りました。御協力、ありがとうございました。校正などはまだ完全ではありませんが。ついては、名著全集本『謡曲三百五十番集』所載の番外五十一番も入れていくことにしました。

    [2005-10-18] 3年前に「もう、今年中には完成したい」と書いて、3年経ちました。最後の八曲ほどが滞っていたので、予約を開放しました。まだエントリーできます。

    [2002-04-10] もう、今年中には完成したいと思ってます。日頃からお世話になっている、岡崎光芳さんに感謝いたします。お送りいただいたものも、こちらの更新が遅れたり してすいません。中嶋謙昌さんも、入力数は僕を抜きました。ありがとうございます。鈴木弘一さんには、御著書もお送りいただきました。古相正美さんも、あ りがとう。中島正二さんにも手伝ってもらってます。お名前、すべて載せられませんし、数の多少の問題でもありません。ご参加くださいましたかたがた、みな さん、ありがとうございます。はやく、「ました」にしたいと思います。

    それから、内田保廣先生、ありがとうございます。当初、一時期の活力を失っていたJALLC(情報処理語学文学研究会)の活性化のためも とおもってはじめたこのプロジェクトですが、こちらは順調に進んでいたにもかかわらず、JALLCはほぼ実質上解散みたいになりました(笑)。いずれにし ても、JALLCの委員長をつとめてこられた内田先生に感謝を込めています。

    [2000-08-31] 予約のうち、110番から133番までを解放しました。某大学の某先生が学生に入力させてくださったものです。あずかりっぱなしでいた僕も悪かったのです が、この夏に中味を開けてみたら、1頁毎に分担させてあり、未提出のものが多くて、完全に揃ったものは一つしかありませんでした。ちと参りました。学生さ んたちごめんなさい。ただし、なんらかのカタチで使いたいとは思っておりますが……。

    [1999-04-26] 予約者名で、いままで匿名にしてたTM氏を公開しました。舘泉美智子氏が、以前、共立女子大学の授業で学生に入力させたものを送っていただきました。データ構造が違うので、これから校正して順次公開してゆきます。校正者も募集しています。メールください。


1998-11-03 open