Box-Cox変換（χ²値による補正を行うバージョン）

Box-Cox変換（χ²値による補正を行うバージョン）は、データ分布の正規性を増し、かつブロック間の等分散性も増加させたい場合に使います。　データ分布の正規性を増すことだけが目的でしたら（あまり、そういう場面は無いと思いますが）、これではなく通常のBox-Cox変換をお使い下さい。

半角文字列で入力し、ブロックごとに改行を入れて下さい。
最初から表示されている数列は入力例です。
5.0 5.0 3.3 4.3 4.0 5.5 4.0 6.0 5.0 5.0 4.0 4.3 5.3 5.0 6.0 6.7 6.5 6.0 6.0 5.3 7.0 5.0 6.3 5.3 4.5 6.0 7.0 2.0 2.5 1.5 1.7 1.0 1.0 2.0 1.0 1.7 2.0 2.0 1.0 1.3 2.5 1.0 2.0 2.0 1.0 3.0 1.3 1.0 2.0 2.0 1.7 1.0 1.0 1.0 4.0 5.3 3.0 3.7 2.7 3.3 5.0 2.7 4.7 3.7 3.7 4.0 4.7 4.3 5.7 4.7 5.3 5.5 4.3 7.0 5.0 5.3 5.7 5.3 4.3 5.0 5.0 5.0 4.3 4.7 1.3 1.3 1.3 1.7 2.0 1.0 1.3 1.3 1.7 1.7 1.3 1.3 1.3 2.3 2.0 2.7 2.0 1.7 2.3 1.0 2.0 2.0 2.0 1.7 2.0 1.3 1.3 2.0 1.3 1.7 5.0 5.0 3.7 3.3 3.0 3.5 3.3 3.0 3.0 4.3 3.7 4.0 4.0 3.3 5.0 6.0 4.0 4.0 5.7 5.5 5.5 5.5 5.3 4.7 5.0 4.3 4.3 3.0 6.0 2.3 1.7 2.0 1.0 1.5 1.0 1.0 2.0 1.0 2.0 1.3 1.7 1.7 2.0 2.0 2.0 1.7 2.0 1.7 0.5 1.7 1.3 1.7 2.3 2.0 1.0 1.0 1.3 2.0 2.0 5.5 3.5 5.3 5.0 6.0 8.0 6.0 4.0 2.0 3.0 2.5 2.0 1.0 2.0 1.0 3.0 2.0
数値の区切り方　　　カンマ，　タブ，　スペース
入力値中の"0"に追加する値　　
↑データーに"0"が含まれる場合、変換操作を行うことができなくなる場合がありますので、そのような問題を回避するため、ここで指定するごく小さな値を入力データ中の"0"に足してやります。　"0"が含まれていないデータを変換するのでしたら、この値には意味はありません。　「いや、そうじゃなくて、俺は全データに一定値を足し合わせたいんだヨ！」という方は、あらかじめ表計算なりで加工したデータを入力して下さいね。

ソースコード（Ruby）

# Box-Cox transformation with an adjustment of chi-square values
# (C) Copyright 2002, Hisashi SATO
# 
# B_test()は、Bartlett's χ二乗値を求めるメソッド

   def Box_Cox2(array, add)

# 定数、変数の初期設定
   length		= 1.0		# ポイント間の初期距離
   ramda_dn		= -10.0			# λ値（下位置）
   ramda_md		= ramda_dn + length	# λ値（中位置）
   ramda_up		= ramda_md + length	# λ値（上位置）

# 配列の準備と全サンプル数の数え上げ、自由度の計算
   sample_number	= 0             # 全サンプル数
   transformed_dn	= Array.new()   # ramda_upで変換されたデータ値
   transformed_md	= Array.new()   # ramda_mdで変換されたデータ値
   transformed_up	= Array.new()   # ramda_dnで変換されたデータ値

   for block in 0..array.size-1
   	transformed_dn << Array.new(array[block].size,0.0)
   	transformed_md << Array.new(array[block].size,0.0)
   	transformed_up << Array.new(array[block].size,0.0)
	sample_number += array[block].size
   end

   df = sample_number-array.size	# 自由度


# データに0が含まれていたら、小さな数を足す
   for block in 0..array.size-1
   for n in 0..array[block].size-1
	if array[block][n] == 0 then array[block][n] += add end
   end
   end

# ■↓■↓■↓■3点法ループの開始■↓■↓■↓■
until length < 0.0001 || ramda_md >= 10

# 変換値とその合計を算出
   sum_dn, sum_md, sum_up, sum_ln = 0.0, 0.0, 0.0, 0.0
   for block in 0..array.size-1
   for n in 0..array[block].size-1
	if ramda_dn != 0 then
	transformed_dn[block][n] = (array[block][n] **ramda_dn - 1) / ramda_dn
	else transformed_dn[block][n] = log(array[block][n]) end

	if ramda_md != 0 then
	transformed_md[block][n] = (array[block][n] **ramda_md - 1) / ramda_md
	else transformed_md[block][n] = log(array[block][n]) end

	if ramda_up != 0 then
	transformed_up[block][n] = (array[block][n] **ramda_up - 1) / ramda_up
	else transformed_up[block][n] = log(array[block][n]) end

	sum_dn += transformed_dn[block][n]
	sum_md += transformed_md[block][n]
	sum_up += transformed_up[block][n]
	sum_ln += log(array[block][n])
   end
   end

# 変換値の分散を算出
   mean_dn = sum_dn / sample_number
   mean_md = sum_md / sample_number
   mean_up = sum_up / sample_number
   varianth_dn, varianth_md, varianth_up = 0.0, 0.0, 0.0

   for block in 0..array.size-1
   for n in 0..array[block].size-1
	varianth_dn += (transformed_dn[block][n] - mean_dn)**2
	varianth_md += (transformed_md[block][n] - mean_md)**2
	varianth_up += (transformed_up[block][n] - mean_up)**2
   end
   end

   varianth_up = varianth_up / (sample_number-1)
   varianth_md = varianth_md / (sample_number-1)
   varianth_dn = varianth_dn / (sample_number-1)

# L値を算出（この部分だけ、通常のBox_Cox変換プログラムと異なる）
   l_dn = -0.5*B_test(transformed_dn) - 0.5*df*log(varianth_dn) + (ramda_dn-1)*df*sum_ln / sample_number
   l_md = -0.5*B_test(transformed_md) -0.5*df*log(varianth_md) + (ramda_md-1)*df*sum_ln / sample_number
   l_up = -0.5*B_test(transformed_up) -0.5*df*log(varianth_up) + (ramda_up-1)*df*sum_ln / sample_number

# L値の評価と次のλ値の設定
   if l_dn < l_md and l_md < l_up then 
	ramda_dn += length
	ramda_md += length
	ramda_up += length
   elsif l_dn > l_md then
	length = length / 4
	ramda_md = ramda_dn + length
	ramda_up = ramda_md + length
   else
	length = length / 2
	ramda_md = ramda_dn + length
	ramda_up = ramda_md + length
   end

end
# ■↑■↑■↑■ループの終わり■↑■↑■↑■

   return  ramda_md
   end

# 心得のある方は、ちょっと読んで頂ければ分かるのですが
# このプログラムでは、一度計算したL値を再び計算し直したりしているので
# 計算量が必要最低量の倍以上も多くなっています。
# λ値－L値のhashを使って、改善しようとも考えたのですが
# ３点法ルーチン部のコードが、かなり読みにくくなることが予想されるので
# 結局、そのままとなっています。

戻る

Box-Cox変換 （χ2値による補正を行うバージョン）

ソースコード（Ruby）

Box-Cox変換（χ²値による補正を行うバージョン）