無駄と文化

実用的ブログ

Haskell でλ計算のインタプリタを作っていこう ~ その1. データ型

f:id:todays_mitsui:20171008025323p:plain


Haskell ネタです。
先日の記事で宣言したとおり、λ計算のインタプリタを作っていこうと思います。

ソースコード全体は GitHub に置いておきます。

github.com

プロジェクト名は Mogul (モーグル) 。
なので作っていくインタプリタの名前も Mogul です。


全体的な注意

このシリーズではλ計算の理論を Haskell で実装していきます。ある程度 Haskell が読み書きでき、かつ、型無しλ計算にある程度親しんでいる人を読者として想定しています。


関数適用の記法には Unlambda記法 を採用しています。が、これはあまり一般的ではないため面食らうかも知れません。

Unlambda記法とは何でしょうか。
関数 f を 引数 x で呼び出すとき、C 言語などでは f(x) と書きます。Haskell では f x ですね。Unlambda 記法ではこれを `fx と書きます。関数適用のための ` という演算子を ポーランド記法 で書いていると思うと理解しやすいかも知れません。
Unlambda 記法には 括弧 () を使わずにあらゆる式が書ける というメリットがあります。が、今回の採用にあたっていちばんの決め手になったのは 筆者が書き慣れているから です。ご了承ください。

その他、解説に使う用語や記号はなるべくλ計算・計算論・関数型プログラミングの分野で一般的なものに統一していくつもりです。


一応以下に参考サイトと参考文献を挙げてみます。

では行ってみましょう。


データ構造

Haskell らしく最初はデータ型の定義から始めます。
今回 Mogul でやろうとしていることを簡単に云ってしまうと λ式を良い感じに β 簡約していく ってな感じなので、まず定義するべきはなんと云っても λ式 です。

結論から見せましょう、データ型の定義はこのようにしました。

import Data.Text

-- | 識別子
data Ident = Ident Text
  deriving (Eq, Ord, Show, Read)

-- | λ式
data Expr = Var Ident      -- 変数
          | Ident :^ Expr  -- 関数抽象
          | Expr  :$ Expr  -- 関数適用
  deriving (Eq, Show, Read)

infixl 9 :$
infixr 7 :^

解説を加えます。

『計算論 計算可能性とラムダ計算』 の第2章「λ計算の基礎」から引用すると、λ式は以下のように再帰的に定義される式です。

  1. 変数 {x_0, x_1, \cdots} はそれ単体でλ式である
  2. {M} がλ式で {x} が変数のとき {\lambda x . M} はλ式である (関数抽象)
  3. {M}{N} がλ式のとき {MN} はλ式である (関数適用)

これをそのまま Haskell のコードに落としていけば素朴なデータ型の定義ができそうです。幸いに Haskell の柔軟な表現力によって、定義式をそのままコードに落とすことができました。

ただし、しっかりと型推論の恩恵にあずかるために 識別子としての変数λ式の一部として現れる単体の変数 を別々の型として区別することにしました。前者は identifier (識別子) を略して Ident という型にしました。後者は variable を略した Var :: Ident -> Expr という値構築子で表現します。


λ計算に追加したいもの

ところで、Mogul ではλ計算の系にいくつかの要素を追加したいと考えています。その一つが 関数定義 です。
関数定義とは λ式に名前を付けて複数の場所で使い回してやろう というアイデアです。みなさんが親しんでいるどの言語にも当たり前にありますよね?

関数定義を許すのには二つの狙いがあります。一つは λ式に適当な名前を付けて参照することで可読性を上げられるであろうこと。もう一つは、 λ式に名前を付けたものでコンビネータを表現できるだろう というものです。

例えば S コンビネータ(『ものまね鳥をまねる』で云うところのホシムクドリ)は以下のように定義出来ますが、

```Sxyz = ``xz`yz

これはλ式 ^x.^y.^z.``xz`yzS という名前を付けることと同義です。

というわけで識別子とλ式を Map で紐付けるようなデータ型を定義します。

import Data.Map.Lazy

-- | 無名関数
data Func = Func
    { args     :: [Ident]
    , bareExpr :: Expr
    } deriving (Eq, Show, Read)

-- | 関数定義の集合
type Context = Map Ident Func

無名関数を表す Func 型を定義した上で、 Map Ident Func によって識別子と関数を対応付けています。
なぜ素朴に type Context = Map Ident Expr とせずに、わざわざ Func 型を定義するかというと、それは アリティ を考慮したいからなのですが。それは、まぁ、β簡約を実装するときにでもあらためて触れましょう。


λ式の同値性

話は少し戻りますが、 Expr の定義で deriving (Eq) として Eq クラスのインスタンスを自動導出していることに注目してください。
deriving 句は便利ですが、Eq クラスのインスタンス定義を自動導出してしまうと意味的には等しいはずの {\lambda x . x}{\lambda y . y}等しくない ということになってしまいます。

-- | ^x.x == ^y.y ?
Ident "x" :^ Var (Ident "x") == Ident "y" :^ Var (Ident "y")
  -- => False

ご存知の通り、α変換 のアイデアで云えば、上記の {\lambda x . x}{\lambda y . y} は同じ関数を表しているはずです。これらの式を比べたとき等しくなるようにするには (==) の定義にα変換のアイデアを持ち込まなければいけません。
これが結構厄介で、上手い実装はないかと長らく考えあぐねていたところに @dif_engine さまから「 ド・ブラン・インデックス を使わない手はないだろう」というアドバイス(空リプ)をいただきました。

ド・ブラン・インデックスを使うと束縛変数の名前( xy など)が表現から完全に消えてしまい、 {\lambda x . x}{\lambda y . y} も同じ {\lambda . 1} という表記で書けるようです。なるほどこれなら複雑なα変換のロジックを持ち出すまでもなく、より賢い (==) の定義が書けそうです。

というわけで、 Expr の定義を以下のように変更しようかと考えています。

type Index = Int

data Expr = Var (Maybe Index) Ident  -- 変数
          | Ident :^ Expr            -- 関数抽象
          | Expr  :$ Expr            -- 関数適用
  deriving (Eq, Show, Read)

Var (Maybe Index) Ident として各変数にインデックスを持たせています。
自由変数にはインデックスを振ることができないので Nothing を割り当てます。

たとえば {\lambda x . \lambda y . FOO \ y \ x} という式をデータに落とすと、

Ident "x" :^ Ident "y" :^ Var Nothing "Foo" :$ Var (Just 1) "y" :$ Var (Just 2) "x"

となります。
...という構想をしていますが、まだ実装してテストはしていません。これも追々で。


まとめ

というわけで初回はλ計算の世界を表現するデータ型についてつらつらと書いてきました。
次回は Mogul の文法を紹介しつつパーザ(parser)の実装を眺めていこうと思います。


私からは以上です。

Apps Script を使ってスプレッドシートに Google アナリティクスのアカウントを一覧表示する

今回は Google アナリティクスのアカウント情報一覧をスプレッドシートに出力する方法をご紹介します。
アナリティクスは無料のプランでさえ 100 アカウントまでサイトを管理できるんですが、50 を越えてくると標準の管理画面ではさすがに見通しが悪くなってきます。
ときには自分の管理しているサイト一覧をスプレッドシートに並べて一覧したくなりますよね。そこで、Google Apps Script です。

出来上がりのイメージは、こんな感じです、

f:id:todays_mitsui:20170926011018p:plain

では早速コードを見ていきましょう。


gist.github.com

putAccountsList() を実行すると Google アカウントの認証画面が現れ、Google アカウントが持つ全ての アカウント×プロパティ×ビュー の情報をスプレッドシートに書き出してくれます。
いつものように日本語コメントをたっぷりと書き加えていますので、内容に興味がある方は読んでみてください。

…ただ、 putAccountsList() を実行するのに若干のコツが必要なので、それを見ていきましょう。


ステップ1. 「Google の拡張サービス」を有効化する

今回、アナリティクスのアカウント情報にアクセスするのに Google Analytics API v3 を使用しています。
Google Analytics API v3 はスクリプトエディタのメニューから事前に有効化しておかなければ利用できません。さらにスクリプトエディタから有効化したあとで Google デベロッパーコンソール上でも同名の API を有効化する必要があります。

若干面倒ではありますが、最初に一回だけやれば済む作業なのでやりましょう。
以下の記事が参考になるはずです。

qiita.com


ステップ2. アプリ権限の確認を乗り越える

どうやら Apps Script から一部の操作をするときに事前に Google の審査をパスしなければいけなくなったようです。
今回で言うと、アナリティクスから取得したデータを スプレッドシートに書き込む操作 に対して、事前に審査をパスしていなければスクリプトを実行させてもらえません。

f:id:todays_mitsui:20170926011111p:plain

こんな感じの画面が出ます。
半年前までは普通に実行できてたんだけどな…。


というわけで回避法です。

f:id:todays_mitsui:20170926011137p:plain

「詳細」をクリックして、

f:id:todays_mitsui:20170926011153p:plain

プロジェクト名 (安全ではないページ) に移動」から進んで、

f:id:todays_mitsui:20170926011206p:plain

「許可」をクリックすると、やっとスクリプトの実行ができます。


ステップ3. 完成

というわけで、スクリプトの実行が完了すればスプレッドシートの方に アカウント×プロパティ×ビュー の一覧が表示されているはずです。

表示している項目は、

  • アカウント#ID
  • アカウント#名前
  • アカウント#ユーザーの権限
  • アカウント#スター付き
  • アカウント#作成日時
  • アカウント#最終更新日時
  • プロパティ#ID
  • プロパティ#名前
  • プロパティ#サイトURL
  • プロパティ#ユーザーの権限
  • プロパティ#スター付き
  • プロパティ#作成日時
  • プロパティ#最終更新日時
  • ビュー#ID
  • ビュー#名前
  • ビュー#通貨のタイプ
  • ビュー#タイムゾーン
  • ビュー#サイトURL
  • ビュー#デフォルトページ
  • ビュー#ユーザーの権限
  • ビュー#スター付き
  • ビュー#eコマーストラッキング有効
  • ビュー#拡張eコマーストラッキング有効
  • ビュー#ロボットフィルタリング有効
  • ビュー#作成日時
  • ビュー#最終更新日時

の全26項目です。
他の項目も出そうと思えば出せるんですが、まぁこれだけあれば管理上は充分でしょう。

他にも出せる項目が気になる方は以下に挙げる公式ドキュメントを読んでみてください。
その気になれば、目標設定やセグメントの設定なども表示できますよ。


まとめ

私はこの方法、100アカウント制限で一杯いっぱいになったときの整理整頓のために仕方なく捻り出しました。
ちっとは Apps Script 書ける人間で本当によかったです。


私からは以上です。

λ計算のインタプリタを作ろうとしている話

f:id:todays_mitsui:20171008025323p:plain


先月、八耐に参加してから 長年個人プロジェクトとして取り組み続けてきた『λ計算インタプリタを作りたい』という欲が再燃しています。
欲が燃えているのは結構なことなので、実際に作ろうと思います。その宣言のための記事です。


作ろうとしているもの

λ計算(λ-calculus) における β簡約 の過程をエミュレートしてλ式が簡約さていく様を逐次(step-by-step)で見せていくようなインタプリタを作ろうと思います。
「λ計算の」と銘打ってますが、もう少し意欲的に コンビネータ理論 とλ計算の両方を同じ文脈の中に記述したものを評価できるように文法を拡張しようと考えています。


手っ取り早く実例を見せましょう。
お馴染みの S, K, I というコンビネータが次のように定義されていて、

S x y z = x z (y z)
K x y   = x
I x     = x

{\lambda x . x x} というλ式をハット記号 ^ などを用いて ^x.x x と書くことにしたとき、
これから作ろうとしているインタプリタは入力 S I I a に対して次のような出力をしてくれます。

S I I a
→ I a (I a)
→ a (I a)
→ a a

λ式を含むもう少し複雑な例、入力 S (K (S I)) K a (^x. x x) に対しては次のように。

S (K (S I)) K a (^x. x x)
→ K (S I) a (K a) (^x. x x)
→ S I (K a) (^x. x x)
→ I (^x. x x) (K a (^x. x x))
→ (^x. x x) (K a (^x. x x))
→ K a (^x. x x) (K a (^x. x x))
→ a (K a (^x. x x))
→ a a

はい。
λ式とコンビネータが計算規則に従って徐々に簡約されていく様子が見えますね?


目的とゴール

目的は λ計算初学者の理解を助け、λ計算の普及と発展に寄与すること です。

λ計算とコンビネータ理論はとても単純な規則に従って式を書き替えていくだけの体系で、それでいてチューリング完全な表現力を持っています。ですが、シンプルが故に簡単な事をするにも式が長くなりがちで中規模以上のプログラムを書こうと思うとコーディングもデバッグも大変になります。

「Hello,world!」を出力するだけのプログラムでさえ、 大変な事 になります。


早い話、理屈は単純なのに計算過程が長くなりがちで分かりづらいのです。
簡約のイメージを掴みきれていない初学者は "Hello,world!" を見るより前に挫けてしまいますよこれじゃぁ!

という訳で、λ計算初学者の理解をサポートする意味では 学習用・実験用のインタプリタ(評価器)を用意すること が重要になります。しかもただ計算結果や標準出力を表示するだけの素っ気ないインタプリタではなく、 計算過程をビジュアルで見せる ことが重要だと考えます。そこでステップ毎の簡約、ステップ毎の表示です。


ひとまずのゴールとして、コマンドラインで実行できるインタプリタを作ることを設定します。が、欲を言えば web アプリの形にしてどこかのページで公開したいと考えています。多くの人にとって web 上に置かれているのがもっともアクセスしやすいでしょうし、HTML+CSS+JavaScript で構成することでよりインタラクティブでリッチな表現をしていけると目論んでいます。


進捗

というわけでリポジトリがあります。

github.com

プロジェクト名は Mogul です。当初は SKI コンビネータ だけを対象とした小さなインタプリタを作ろうとしていたので、SKI(スキー) から連想して、スキー競技の一つである「モーグル」の名前を冠しています。

Haskell で書き進めていて、関数適用の書き方には Haskell 記法 f x y ではなく Unlambda 記法 ``fxy を採用しています。
動作イメージは 前回の記事 にも貼ったとおりです。

f:id:todays_mitsui:20170830232523g:plain


パーサ, 抽象構文木の生成, 素朴な eval, λ式の印字 くらいまでは書けていますが、多分にバグがあります。肝心の eval がα変換を考慮しない実装になっているために、内部的に同名の変数を含むコンビネータ同士を演算すると正しくない結果を返すようになります。


今後はこのリポジトリを良い感じにアップデートしていくとともに、λ計算インタプリタを Haskell で実装するにあたっての考え方を記事にして当ブログに投稿していこうかと思います。そうやってモチベーションを維持しつつ、強い Haskeller さんから指摘を受けて完成までの道のりを縮めていこうという狙いもあります。
いいものが作りたいんや俺は。


私からは以上です。