Skip to content

UiPath PDFを自動化する

Posted in RPA, and UiPath

お久しぶりです。

エピックです。

ここ最近別件に集中していたため全く更新が出来ておりませんでした。。

最近、コロナの影響もあるのか、はたまたもとからなのか分かりませんが「個の時代」と叫ばれておりますのでブログ頑張っていきたいと思います。

今まで堅苦しく書いておりましたが、比較的ゆるく日常も混ぜ書いて行くつもりなのでよろしくお願いします。

今回は。UiPath でのPDF自動化について書いていきたいと思います。

理由は、UiPath Academy が更新されていたのでちょうど「PDFの自動化」を完了したのがきっかけです。

より分かりやすく整理してお伝えできればと思います。


PDFには2種類ある

PDFを日常多用している方はご存知かもしれませんが、PDFにはテキストがちゃんと文字情報として保持されているPDFと画像として保持されているPDFの2種類があります。

これは、PDF上でマウスを当ててみれば分かります。

  • 文字情報を含むPDF
  • 文字情報を含まない(画像となっている)PDF

PDFの自動化を行う場合は、これらのタイプを事前に把握してく必要があり、それにより利用すうアクティビティを使い分けます。


PDF アクティビティのパッケージインストール

UiPathには、PDFを自動化するためのアクティビティパッケージがありますが、デフォルトではインストールされていません。

そのため、パッケージを管理から追加でインストールを行う必要があります。

UiPath Studioの上パネルから【パッケージを管理】をクリックします。

すると、新しいウィンドウが開くので上の検索欄に「PDF」と打ち込みます。

「UiPath.PDF.Activities」が表示されるので、右のインストールを押し、保存をします。

同意画面が出る場合は、内容を確認した上で「同意」を押します。

インストール完了後、アクティビティ一覧にPDFアクティビティが表示されているはずです。


PDFでの利用アクティビティの整理

利用するアクティビティは、PDFが「文字情報を含むPDF」であるかどうかで判断します。

考え方を整理したチャートを下記に記載します。

チャート上にも記載してますが、文字情報を含まないPDFの自動化はUiPath単独では難しいと考えるほうが良いです。

また、【PDFのテキストを読み込み】を利用した場合、すべてのPDF上のテキストが取得されます。

必要な項目のみ取得したいとなった場合は、文字列の操作、正規表現等で対応する必要があります。(結構大変であまり現実的ではない気がします)


自動化のサンプル

最後にPDFリーダである Acrobat Reader DC とUIPathでどのように自動化を行うか簡単なサンプルを紹介します。

前提条件として、PDFは文字情報を保持しているものとし、フォーマットは統一されているとします。(これだけで現実業務と乖離があるきが・・)

また、PDFは一般的な業務を想定し、特定フォルダ内にまとめて格納されているとしましょう。

(Acrobat Reader DC はここから入手できます)

1. 特定フォルダを読み込む繰り返し処理の実装

【繰り返し(コレクションの各要素)】アクティビティを利用してフォルダの中のファイルを順次取得します。

プロパティの「値」の欄には、下記のように.Netの文字列を入力します。

UiPath のバージョン2019.10.5を利用しているのですが、サジェスチョンが出るようになったんですね、超便利です。


2. ファイルを指定しAcrobatを起動する処理の実装

続いて、ファイルを対象に Acrobat DC を起動します。

アプリケーションの起動となるため、【アプリケーションを開く】アクティビティを利用します。

普段どおりの使い方で良いのですが、今回対象のファイルを指定して起動をするためプロパティパネルの [入力]-[引数] に値を入力する必要があります。

下記画像のように入力をしてみてください。


3. 【テキストを取得】アクティビティを利用して対象テキストを取得する処理の実装

これもいつも通りですね、PDFが文字情報を含んでいるので読み取りたい箇所を指定してあげます。

今回、フォーマットが同様な複数のPDFを繰り返しで処理するため、セレクターの修復を行いアップデートをしておくのを忘れないでください。


4. アプリケーションを閉じる処理の実装

繰り返し処理をしているので、前のPDFが開いた状態だと誤認識をしてしまう可能性があります。

そのため、繰り返しごとにアプリケーションを閉じる処理を実装しておきましょう。

最終的な完成イメージは次のようになります。


おわりの一言

UiPathでのPDF自動化は、業務の内容にもよるが一般的なバックオフィス業務を想定するのであれば別のツールとの連携を考えるほうがよいと思います。


今回も最後までお読みいただきありがとうございました。

ご不明点等は気軽にコメントいただければと思います。

では。


単行本(ソフトカバー): 208ページ 出版社: インプレス (2018/10/15)
単行本(ソフトカバー): 464ページ 出版社: 翔泳社 (2020/5/25)

Be First to Comment

コメントを残す