3-4-4 Excel、Word、PDFファイルから作成する

Form DesignerでExcel、Word、PDFファイルを読み込むと、内部的に「SVF Image Printer」へ出力し、400dpiの画像ファイルに変換後に下絵として表示します。また、「SVF Image Printer」へ渡る情報から罫線や固定文字を抽出して、XML様式ファイル上に自動的に配置します。


Excel、Word、PDFのファイルから罫線や文字を自動抽出

制限事項

64bit版のOSでは、[ファイルから文字と罫線を読み込む]機能は利用できません。

注意
  • Microsoft Excel、Word、Adobe Acrobat/Adobe Readerがそれぞれインストールされている必要があります。
  • Microsoft ExcelおよびWordを起動していない状態で実行してください。
  • PDFファイルからは文字を抽出できません。
  • Wordファイル、Excelファイルからのイメージ読み込み時に生成されたBMPファイルの保存先ディレクトリとそのファイル名の指定は、[設定]-[動作設定]-[イメージ読み込み]で行います。
    BMPファイルの保存先ディレクトリとファイル名は、Word、Excel、PDFファイルを読み込む前に指定する必要があります。保存先ディレクトリを設定せずにファイルを読み込んだ場合は、エラーメッセージが表示されます。


    動作設定]ダイアログの[イメージ読み込み

Excel、Word、およびPDFファイルを元にXML様式ファイルを作成する場合は、次の手順で操作します。

  1. 新規フォームを作成する

    ファイル]-[新規フォーム]を選択し、新しいフォームを作成します。

  2. 用紙サイズと方向を指定する

    読み込むファイルの用紙サイズと方向に合わせて、[プロパティエディター]で[用紙サイズ]および[用紙方向]を指定します。

  3. 下絵となるファイルを選択する

    アイテム]-[ファイルから文字と罫線を読み込む]を選択し、[開く]ダイアログを開きます。下絵とするファイルを選択して、[開く]ボタンをクリックします。


    開く]ダイアログ

  4. 下絵の表示とアイテムの配置

    選択したファイルの内容が帳票イメージとして読み込まれた後、自動的に抽出された罫線や文字がアイテムとして配置されます。読み込むファイルがPDFの場合は、罫線のみが抽出されて配置されます。


    自動的にアイテムが配置される

参考

各種ファイルから罫線や文字を抽出する場合は、関連付けされている(ファイルをイメージ化する)アプリケーションが、「SVF Image Printer」に文字を文字情報として出力するかイメージ情報として出力するかによって、固定文字の抽出が可能かどうかが決まります。
PDFファイルの場合は、文字はイメージ出力されるため、文字としては認識されません。また、WordやExcelファイルの場合でも、イメージ画像として貼り付けられている文字の抽出はできません。

  • ファイルから文字と罫線を読み込む場合は、プリンターに出力される文字を読み取ります(OCRは使用しません)。
  • 帳票イメージから文字を読み込む場合は、OCRにより文字を抽出します。文字サイズについては、どちらの取り込み方法でも多少の違いが発生します。
参考

意図する向きでイメージが読み取られない場合は、コントロールパネルのプリンターから、「SVF Image Printer」のプロパティを開き、[印刷設定]-[レイアウト]タブの[印刷の向き]で、方向を変更してください。
設定方法の詳細は「付録3 よくある質問(FAQ)」の「Q.Windowsのペイントなどでは正常に表示されているのに、[ファイルから文字と罫線を読み込む]でGIFやTIFFなどの画像ファイルを読み込むと、90度回転されて表示されてしまいます。」を参照してください。

「ファイルから文字と罫線を読み込む」場合の制限事項

文字に関する制限

  • フォントは、[設定]-[動作設定]-[範囲/OCR 設定]の「固定文字、直線の設定」で指定してあるフォントです。
  • ファイル読み込みの場合は、縦書きには対応しておらず、次のように変換されます。
    • Excel
      1文字ずつ別々に変換されます。
    • Word
      横書きの小さい文字に変換されます。
  • ExcelやWord上で指定しているフォントサイズと同じサイズでは取り込めません。若干小さくなります。
  • 倍角文字では取り込めません。作成される固定文字の倍率は、縦横とも1です。
  • パステル系の明るい色(黄色、黄緑色、水色など)の文字は、認識されない場合があります。
  • 均等割り付けを使用した文字は、連続した文字列として認識されない場合があります。
  • 「"」「~」「|」「_」などの記号文字は、きれいに取り込めない場合があります。

罫線に関する制限

  • Excel、Word上で、同じ線幅で設計されている場合でも、それぞれ異なる線幅でイメージが取得されることがあります。
  • 斜め線は認識できません。
  • 左上の角が丸い表は認識できない場合があります。
  • パステル系の明るい色(黄色、黄緑色、水色など)の罫線は、認識されない場合があります。
  • 罫線の色は区別されず、黒色として認識されます。

その他の制限

  • Excel、Word共通
    • イメージを取得するには、Ver. 9.2 Service Pack 6以降を適用し、あらかじめ次のバージョン以上のMicrosoft Officeがインストールされている必要があります。なお、イメージ取得はMicrosoft Office 2000から2016のExcelおよびWord形式に対応しています。
      • Microsoft Office 2013
        • Microsoft Word:15.0.4779.1001 MSO(15.0.4779.1000)
        • Microsoft Excel:15.0.4779.1001 MSO(15.0.4779.1000)
      • Microsoft Office 2016:バージョン 1707 (ビルド 8326.2070)
        • Microsoft Word:MSO(16.0.8326.2062)
        • Microsoft Excel:MSO(16.0.8326.2062)
    • 生成されるイメージデータの大きさが約2MBとなるため、ページ数が多い場合はディスクの空き容量が必要です。ディスクの空き容量不足によりイメージデータ生成ができない場合は処理が中断され、イメージが取得されません。
    • 特殊文字は「?」に変換されます。
    • 変換できない通貨記号(ユーロなど)は「?」に変換されます。
    • 商標「™」など、取得できない特殊文字があります。
  • Excel
    • セルに設定された「=NOW()」など文書が更新される関数がある場合は、変更を保存するかどうかのダイアログが表示されます。
  • PDF
    • あらかじめAdobe Readerなどのアプリケーションがインストールされている必要があります。
    • 文字の抽出には対応していません。
  • OS
    • Windows XP SP3にJIS2004対応フォントパッチ(MS ゴシック & MS 明朝 JIS2004 対応フォント)をインストールしている環境で、Excel、Wordファイルを読み込む場合は、全角文字を含む文字列は取り込めません。
    • 64bit版のOSでは、[ファイルから文字と罫線を読み込む]機能は利用できません。