4.精確さと不確かさ

4.1 精度と真度

 標準試料を何回か分析するとばらつきを持ったデータ群が得られますが,その平均からのばらつきを標準偏差で表し,それが小さいのを精度がよい,また平均値が理論値に近いのを正確さが高いと長年言ってきましたが,1994年国際標準化機構の品質規格改訂(ISO 5725-1)により用語や定義に少し変化がありました8)

 まず精度についてはばらつきを標準偏差で表す点で同じですが,分析条件が固定されているときは(分析者,装置,環境,日時が同じ),繰り返し精度repeatabilityと言い,普通われわれの元素分析データはこの状況のものです.しかし分析者が複数で交代に出したデータの集計とか一ヶ月の変動を含めたデータの統計などは再現精度reproducibilityとなります.繰り返し精度のことを再現性と言う方がありますが,正式には間違っています.

 一方正確さに関してはばらつきのあるものの平均をとってそのデータ群の代表とさせるには少し問題があります.ばらつきが小さいときはそれでも納得できるかも知れませんが,ばらつきが大きいとたとえ平均値が理論値に一致しても正確な分析ができているとは言えないでしょう.ISOでは正確さの代わりに真度truenessの用語を設け,データからどのくらい離れた所に真の値があるかを表すことになりました.

 真の値とは厳密には知り難いのですが,よく校正された分銅の質量値や標準試料の化学構造から計算される理論含有率などを参照値として代用することができます.得られた個々のデータやデータ群の平均値が真の値にどのくらい近いかが真度ですが,要するに従来のかたよりが真値を先に仮定してそれからのデータのずれを考えたのを,逆にデータがあってそこから真の値までの距離を見る積極的な姿に変えたと言えるでしょう.

さて精度と真度が決りましたが,データの質としてはどちらも必要で,これらを兼ね備えたデータは精確さaccuracyが良いと言う事になりました.精確さは自由に変化する二つの要素からできていますので,総合評価に数値的な基準を設けることは困難ですが,要求される精度と真度がどちらも高ければ精確さも良いということになります.結婚式では花嫁が才色兼備であることになっていますが,正直言って二要素の程度と組み合わせがいろいろあって,仲人はどの程度に誉めるか言葉に苦労するようです.精確さと正確さは発音が同じで暫く混乱があるかも知れませんが,正確さが使われなくなり,真度に置き換わる時がくればこの問題も解決するでしょう.取りあえず以上をまとめると,次のようになります.
   精確さ: 精度+真度
   精度:  繰り返し精度(同一条件)と再現精度(異なる条件)
   真度:  真値との隔たり(旧かたより)

 得られたデータは母集団の中のある場所から取り出したもので,それが偶然目標の値に近くてもそのまま信用できるとは限りません.依頼分析などで報告されたデータが期待の分析値に最終桁まで一致することがありますが,本来ばらつきのあるデータ群の一番外れたところを貰った可能性もあります.場合によると分析全体が間違った標準で流れていて,その間違いが原因で実際とは違う化学構造の理論値に一致してしまうなどということもあり得ます.

 標準が狂っていてはすべてが信用を失いますが,この信用を支えるのはトレーサビリティ traceability の確保です.この用語は最近よく使われるようになりましたが,由来が辿れるという意味で,平たくいえば家の系図があって先祖から自分の代までのつながりが明らかであるというのと同じです.最近の狂牛病さわぎで牛肉のトレーサビリティを表示することになったようですが,ここでは牛の種類,原産地から処理場所,流通経路まで明記させ,消費者が何を食べているのか分かるように計画しています.

 はかりの分銅はキログラム原器が出発点で,100 g,10 g, 1 gと厳密な比較測定を繰り返しながら質量を下げ,最後はミリグラム分銅に到りますが,そこではキログラム原器の質量を出来る限り精密にトレースしています.この分銅を使って校正されたはかりは目盛りにしろデジタル表示にしろすべてキログラム原器の質量から来ていますから,このはかりの測定値には質量に関して高度のトレーサビリティがあるといえます.ただし分銅の汚れやはかりの感度に変化があるとそのトレーサビリティは崩れるので,ときどき分銅の比較検査やはかりの感度の校正をしてトレーサビリティを取り戻さなければなりません.

 定量分析ではサンプリングから始まって,燃焼分解,成分の分離や発色,滴定などいろいろな過程が組み合わされて結果が得られますが,いずれの過程も量の基準が同じ標準に統一されなければなりません.具体的にはサンプリングに使うはかりがキログラム原器の質量をトレースしているので,他の過程も同じ流れに乗っている必要があります.

 試料の燃焼分解によって得られる成分の量は反応が100%の効率で進んだときに,サンプリングと同じ質量のトレーサビリティに乗ることができます.しかし効率が100%でなかったり,成分の損失や汚染があるとトレーサビリティは崩れます.成分の分離や発色も,標準液の一定量で同じことを行って効率や発色率を知っておけば成分量が標準化されます.滴定などに用いる量器は目盛りがJIS規格で管理されていますが,元をただせば目盛りを充たす水の質量で体積が計算されているので,これはキログラム原器の質量をトレースしていることになります.熱伝導度セルや吸光度計の電気的出力もはかりで計量した標準試料で感度係数を決めますから,それで得られた成分量は間接ですがキログラム原器の質量をトレースしています.

 建前としては一連の分析プロセスがすべてキログラム原器にトレーサビリティを持っていて何の問題もなさそうですが,それでも微量分析ではあまり安心できません.例えば試料の計量に分析室の微量はかりを用い,滴定標準液に試薬メーカーから買ったものを使うと,後者は試薬メーカーの持つ化学はかりで濃度や力価を決めてありますので,分析室の微量はかりと試薬メーカーの化学はかりの標準からのずれの違いが分析結果に現れます2)

 微量はかりのトレーサビリティについては過去に大掛かりな調査があり2),9),問題点の解消にむけた努力が実を結び,現在では面目を一新していますが,それでも不特定の化学はかりと微量はかりが同じトレーサビリティを持っているかと言われると多少不安があります.滴定液の濃度や力価は分析室の微量はかりで標準試薬を計量し,これを溶媒に溶かして滴定して求めたほうが標準の統一がとれて安心のように思います.

4.2 分析誤差と不確かさ

 誤差は分析結果と真の価との差であると概念的に言われていますが,真の価はどうして分かるのかと言うと,それは物質の融点のように大勢で決めた公定値であったり,元素分析のように分子式と原子量から求めた計算値であったりします.真の価より高い分析値には+の誤差として,低い分析値には−の誤差として表されますが,真の価がないときは勝手に+や−をつけることが出来ません.しかし真の価は無くても分析結果はばらつきを持ったデータ群から取り出した一例ですから,その価のあやふやさは範囲で表すことができます.これが与えられたデータの不確かさで,データのほうから見た真の価のありうる距離を示していて,+や−の表示はしません.ただしこれは余り厳格には守られていないようで,±の表示をするのも見られますが,丁度標準偏差の値に本来不要な±をつける人があるのと似ています.

 不確かさもばらつきが原因ですから,統計原理が働きます.不確かさが単純なものであれば,旧来の標準偏差の数値で表せますが,これを新しく標準不確かさstandard uncertaintyと呼び,uで表します.もし不確かさが複数あればu1, u2, ・・・ u が累積し,それぞれの分散の合計として合成分散Zが得られますが,
      Z = u12 + u22 +・・・+ un2  
これから合成標準不確かさcombined standard uncertainty, ucが求められます.すなわちZの平方根がそれで,
      uc = Z1/2
となります.新しい用語が出てきて戸惑うかも知れませんが,従来の標準偏差,分散の考え方と同じですから,古い用語と置き換えればさほど難しい話ではありません.標準偏差が分かっておれば,得られた測定値と真の値の差が不確かさで表現されます.

 サンプリングに例をとると,空のボートを測り,試料を載せてもう一度測り,その差をとるので,2回の不確かさが累積しています.はかりの標準不確かさがubとすると試料量の合成分散はZ = 2 ub2となりますから,試料量の標準不確かさはuc = 21/2 ubです.分析結果はそれからいろいろなプロセスを通って与えられるので,実際には複雑な合成要素が絡みあっています.

 ここまでの不確かさの見積もりは確率68%で行われましたが,これを確率95%に引き上げると不確かさは2倍の範囲にしなければ納まりません.これを拡張不確かさexpanded uncertaintyと称し,Uで表します.確率を広げる係数は2倍でなくてもよいので,一般的には包括係数kと呼んで,U = k ucで表していますが,普通k = 2で計算されます.これは95%確率で見積もっているので,殆ど全部のデータがこの範囲に入ると考えてよいでしょう.例えばある分析装置のデータが標準偏差0.12%で得られるとき,未知試料の分析値72.15%の不確かさ(普通拡張不確かさを取ります)は0.12×2=0.24%で,真の値は72.15±0.24%の幅の中に95%の確率で存在することを意味します.

←BACK →NEXT