訴訟では、訴状からはじまって、答弁書その他の準備書面という「主張書面」を書いて、裁判所に提出します。
この準備書面には、相手方の主張する事実を否認する場合には、その理由を記載しなければならないとされていますので(民訴規則79条3項)、相手方の主張に対する「認否」をするのですが、一般の方には、分かりにくい部分です。
この認否は、たとえば、「訴状 第○「****」の「○.****」の第○段落の第○文は認める(否認する、不知)。」などというように、認否の対象となる相手方の文章を文章で特定して行うのが一般的な手法です。
今でも大半の弁護士はこういう書き方をしますが、これは、慣れていない方には分かりにくいと思います。
そこで当事務所では、数年前から、相手方の主張書面にOCRをかけてエクセルに貼り付け、分かりやすいように見出し行にインデント設定をしつつ、段落毎の文章の右側に、認否を記載した「別表」を作成し、別紙として提出しています。
民事訴訟規則には、認否の記載方法まで指定しているわけではないですし、この方法で、裁判所から指導を受けたことも、相手方からクレームがでたこともありません。
依頼者の方には、従来型の認否書面よりも明らかに分かりやすい、と言われています。
この方法でポイントとなるのは、OCRの精度です。
訴訟書面は、長らくFAXで直送されてきましたが、解像度が低いFAXだとOCRの認識率も低くなります。紙で送られてきた書面やTeamsとかmintでダウンロードした書面でも、テキスト化にはOCRソフトが必要ですが、現時点では認識率が完璧ではないので、ずっと手作業で修正をしながら読んでいました。
ところが、ここに来てほぼ修正をしないでよくなりました。
というのは、オンプレミスのLLMにビジョン機能が搭載された120Bクラスのものを利用することで、OCRをかけたPDFの修正が、完璧といっていい精度まで高まってきたからです。これは、自分にとっては感動ものといっていい事件でした。
高解像度PDFはもちろん、FAX書面ですら、人の目では見逃してしまうような微妙な誤認識も修正できるのです。
将来的には、データによる裁判が主流になり、OCRの必要性は薄れるかもしれません。
ですが、こういう作業をしていると、次の可能性が見えてきます。
つまり、個々の主張をデータベースに格納し、ベクトル化して検索したり、照合したり、抽出できる。オンプレミスで。
実際、これで相手方の主張に矛盾を発見することは・・・、すでに起こっています。
さらに、当事者の主張を統合して時系列を作ったり、事実関係で矛盾する部分を指摘することも可能です(これはまた別の機会にしましょう。)。
こうしてみてくると、ローカルLLMというのは、OCRの修正だけではなくて、将来的に、弁護士事務所だけでなく、どこよりも裁判所にとって不可欠な技術、だということが分かります。
こういう技術が開発されることで、裁判業務はより客観的で公正なものとなり、より、社会に開かれていくのでしょう。
