パラダイム | 日本語プログラミング言語 |
---|---|
登場時期 | 1985年頃か[1] |
設計者 | 片桐明 |
影響を受けた言語 | Forth |
プラットフォーム | MS-DOS, Windows, UNIX |
ウェブサイト | www.scripts-lab.co.jp/mind/whatsmind.html |
Mind(マインド)は、Forthから派生した[2]:170、(プログラミング言語としては)日本語っぽい自然な見掛け(と主張されている)が特徴であるプログラミング言語で、いわゆる日本語プログラミング言語のひとつである。しかしあくまで「プログラミング言語としては日本語っぽい」ということであり、(時折誤解されているが)自然言語プログラミング(w:en:Natural language programming)言語ではない。
Forthのワードに相当する「単語」の他、全ての識別子に、日本語の文字(かな・漢字・他)が使える。Forthと同様に逆ポーランド記法ベースであるが、逆ポーランド記法と日本語の語順の類似性を活用している。[2]:170
設計者は現在スクリプツ・ラボの片桐明で、MS-DOS時代には同社の前身のリギーコーポレーションからの販売であった。MS-DOS版は今はフリーウェア扱いになっている。2013年現在、Windows版(商用。評価版ダウンロードあり)とUNIX版(GPL)があり、スクリプツ・ラボが販売・提供している。他に、第三者によりUNIX版をB-right/V(超漢字)で動くようにしたものがある。
また、2012年4月から、2013年現在、Android版の実験が進められている[3]。
外部リンク1のページより、プログラム例を引用する。
午前?とは 時刻を得て 時が 12より 小さいこと。 メインとは 午前? ならば 「おはよう」を さもなければ 「こんにちは」を つぎに 表示し 改行すること。
このように、基本はForthである。数値以外のほぼ全てに日本語の文字や日本語の記法を使う。たとえば、Forthでは ;
である定義の終了が「。
」である。以下、Forthと異なる特徴の主なものを挙げる。まず、文字種の違いをトークンの認識に積極的に使う。「12より」を数値の 12 であると認識する。「時刻を得て」のうち識別子として有効なのは「時刻得」であり、平仮名を基本的に無視することで自然な表現を助けている(おそらく助詞か活用語尾のような部分だが、単に字種に基づいて判断しているだけであり、自然言語処理的な扱いにより助詞ないし活用語尾として認識しているわけではない)。なお一方、単語の定義の「〜とは」のように、平仮名がキーワード的に重要な意味を持つ場合もある。
Forthと同様に、単語を定義し、それを以降の単語の定義で使用するといったスタイルをとる。すなわち、Mindのプログラムは、Forthと同様に単語の定義の集まりである。また、引数が表面に表れない。他言語のプログラマが最も驚くのはこの点かもしれない。最初は違和感があるが、慣れるとForthと同様に非常に簡潔にプログラムを書くことができる。
インデントなどのレイアウトには見やすさのため以上の意味はない。
4と 5を 加え 表示する。
同じ外部リンク1のページのある他プログラム例のメイン部分を引用する。
メインとは 接続処理し 送信処理すること。
このように、プログラムがそのまま、動作記述のドキュメントとして読めると主張される。
Mindは、従来「日本語プログラミング言語」と主張されたような、既存のプログラミング言語の予約語などを日本語化し、識別子に日本語の文字を使えるようにして、トランスレータを通すようなものとは、日本語プログラミング言語として言語仕様が設計されているという点で、一線を画している(日本語によるプログラミングは、研究レベルでは以前にもある。また、代表的なところでなでしこなど後続も現れている)。
一見すると、自然言語によるプログラミングと誤解されることがあるが、自然言語処理は(その手法を取り入れている部分はあるが)おこなっていない[4]。たとえば基本的にわかち書きが必須であり[2]:170、Mindのルールに従った分割が必要であることが挙げられよう(日本語の自然言語処理において、わかち書きされていない普通の自然な文字列からの文節の切り分けは一大テーマである。また、膠着語である日本語は、本来的には語順と意味との結びつきは弱く、逆ポーランド記法との類似性は偶々であり、類似しない構文もあることが古くに指摘されている[5])。自然言語でプログラミングするのではなく、基本的には普通のプログラミングと同じようにコーディングする、手続き型プログラミング言語で、ただしForthのようにスタック指向である。
識別子には日本語の文字が使えるが、活用語尾のように見えるひらがなの部分を基本的には無視するという仕様である。これは単純に機械的にやっている。このため、識別子は漢字もしくはカタカナの部分で、識別できるようにしなければならない。[2]:170,175ひらがなは無視されるばかりではなく、逆に、単語の定義の「〜とは」のように日本語の助詞に「標識」(言語学の用語)のような意味を持たせている場合もあり、「3から 2を 引く」と「2を 3から 引く」(こちらは標準的でないとされているが)はどちらも日本語としての直感通り 1 になる(Forthとしては、普通ではないと思えるだろう)。
Mindに限らずForth系一般の特徴であるが、プログラミング中はスタックの使用状況を強く意識する必要がある。特に単語(ワード)の呼び出し前後のスタックの変化をつかんでいないと、たちまちスタックの状態を混乱させてしまう。また、プログラムを書く時ではなく読む段においては、表面上一見すっきりと見えるのとは裏腹に、その裏側でスタックの状態がどうなっているのかを把握しなければ、デバッグなどができない。Forthでよくおこなわれている、単語の定義にスタックの状態変化を説明するコメントなどは是非付けたいところだろう。
変数には数値や文字列に加え、配列変数や構造体(「ランダムファイル」と呼ばれる)を格納できる。[2]:171
低水準の操作のための単語もありシステム周りの記述も行なえる。[2]:172クラシックなForthではあまり一般的でないものを、言語仕様に取り入れている点もあり、局所変数や、四則演算が中置記法で書ける数式表現などがある。
Mindが発表される前に、Fifth86という製品があった。Version5までのMindはFifth86で書かれていた[6][2]:170。Forthにはたまに見られるが、Fifthはインラインアセンブラの機能を持っていた。Fifthという名称はForthの次、といったようなものである(Forthは、4番めFourthに由来する)。
MS-DOS時代のVersion5まではインタプリタ的な対話環境と、コマンドライン版と言語中からも使える(単語「コンパイル」でコンパイルができる)コンパイラがあり、この時代のコンパイラは機械語コードを生成していた。1989年からOS/2への移植(リリースされず)に備え、この時に「Mコード」と呼んでいる中間表現方式を採用した。UNIXに移植したコードネームS6では、コア部分の実装をアセンブリ言語(機械語)からC言語に変更し、同時にコンパイラの出力を機械語出力から環境非依存な中間表現のバイナリコードの出力に変更した。これらは評価版リリースであった。UNIX版のVersion7がプロダクトとしてリリースされ、ソースの多くを共通にしたWindows版も同じバージョン番号系列でリリースした[7]。現在[いつ?]は中間表現を実行するコア部分と、Mindで実装されたコンパイラ、さらにWindows版ではGUI版ランタイムと、それらのフロントエンドのGUI環境を提供している。
ぐるなびの全文検索に2004年5月から6年間使われていたエンジンはMindを発展させたスクリプツ・ラボのMindSearchIIを用い開発された。[8]:196
マイクロソフトウェアアソシエイツから発売されていた[9]MS-DOS向け日本語ワードプロセッサ「キムラ太郎」はMindで実装されていた。(この名前は一太郎と木村太郎の駄洒落)
富士通から発売されていた「FM秘書」のソースコードはMindで記述されていた。[2]:174また、日本語ワードプロセッサ専用機の『OASYS-30シリーズ』のMS-DOS起動システムには、プログラミング言語としてMindが添付されていた。
教育用言語としては、LOGOより効果が高いことが確認された。[8]:196