Die folgende COM Control Anwendung kann in Ms Office Programme eingebunden werden um PDF Dokumente als Text zu importieren.
Dabei muss man das COM Control in den vba Makro Code einbinden und kann dann per einzelnem Aufruf den Text-Inhalt einer Pdf Datei erhalten und anschliessend in das Excel oder Word Dokument übernehmen
Anwendung:
in Excel Word Powerpoint Access
Betrifft:
Vba Makro Code, PDF Reader PDF Import
Code-Seite
Beispiel in Excel
Funktioniert auch in Ms Word, Office, Outlook, Powerpoint
Mit den Zeilen wird der PDF Reader aufgerufen und der Text des PDF Dokuments als String ausgelesen
'< get PDF Text > Dim pdf_Reader As New Pdf_Text_Reader.pdf_Reader sText = pdf_Reader.get_Text(sFilename) '</ get PDF Text > |
Beispiel Code in vba
Option Explicit On
Public Sub Read_PDF_Text() '------------< Read_PDF_Text() >------------ Dim ws As Worksheet Set ws = ActiveSheet
Dim sFilename As String sFilename = "C:\_Daten\Desktop\VS_Projects\ActiveX\Pdf_Text_Reader\_Test\PDF_Import_Excel.pdf"
Dim sText As String
'< get PDF Text > Dim pdf_Reader As New Pdf_Text_Reader.pdf_Reader sText = pdf_Reader.get_Text(sFilename) '</ get PDF Text >
'----< Read as Lines >---- Dim arrLines arrLines = Split(sText, vbLf)
Dim iLine As Integer iLine = 1 Dim vLine For Each vLine In arrLines iLine = iLine + 1 ws.Cells(iLine + 20, 2).Value = vLine Next '----</ Read as Lines >----
'------------</ Read_PDF_Text() >------------ End Sub
|
Control Einbinden
Hierzu muss man das folgende COM Control einbinden
(im Anhang zum Download)
Zur Makro Code / Vba Code seite kommt man mit Alt-F11
Vba-Code Seite ->Menü->Extras->Verweise
Und dann mit Durchsuchen die Datei : Pdf_Text_Reader.tlb einbinden
Installation
Pdf_Text_Reader.dll
Der Pdf_Text_Reader ist eine COM Control Datei, welche als .dll vorhanden ist. Die Anwendung verwendet iTextSharp zum Auslesen des Textes.
Die Register.bat und Unregister.bat dienen zur Installation auf dem Rechner.
Die folgenden Dateien werden im Anhang benötigt.
Register.bat
Auf dem Zielrechner muss man die Register.bat anpassen.
In der Register.bat steht der Code zum Installieren auf dem PC
In der register.bat muss man mit Bearbeiten den Pfad zur COM.dll Datei anpassen.
Einfach die xxxxx austauschen gegen den Pfad, wo sich die Datei Pdf_Text_Reader.dll befindet
C:\Windows\Microsoft.NET\Framework\v4.0.30319\regasm.exe "C:\\xxxxxxxxxxx\Pdf_Text_Reader.dll" /tlb /codebase pause |
Dann die Datei ausführen als Administrator