Dit is een aanvulling op het antwoord van @Dennis van 18:06 30 jul 2012. Hij gaat zeker in op het moeilijkere geval.
In het eenvoudigste geval waarin het watermerk een eenvoudige, onopgesmukte tekst is, bijvoorbeeld
Smedley Voor Commissaris
zouden de ongecomprimeerde PDF-watermerken als volgt gedefinieerd kunnen worden:
BT
75.96 625 Td
(Smedley For Commissioner)Tj
ET
waarbij 75.96
de horizontale offset is en 625
de verticale offset voor dit specifieke watermerk. (Ja, zowel reële getallen als gehele getallen mogen worden gezien.)
Een regexp als de volgende werkt voor al dergelijke watermerken, waarbij variaties in hun plaatsing worden genegeerd:
^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n
Wees u er echter van bewust, dat een verscheidenheid van wijzigende PDF operatoren in het spel kan komen met watermerken die een ingewikkelder opmaak hebben. Zulke ingewikkelde opmaak kan wat de lezer verwacht (hoopt?) een aaneengesloten, gemakkelijk te doorzoeken string te zijn, veranderen in een warboel van alfabetsoep. Bijvoorbeeld,
E1 = mc² door Smedley™
Zou het product kunnen zijn van:
BT
75.96 625 Td
(E)Tj
-5 Ts
(1)Tj
0 Ts
( = mc)Tj
5 Ts
(2)Tj
0 Ts
(by Smedley)Tj
5 Ts
(TM)Tj
0 Ts
ET
… of nog veel erger als uw watermerk gekleurd is!
Dit alles opgemerkt hebbende, wil ik ook nog opmerken dat PDFtk een GUI versie heeft die beweert met watermerken overweg te kunnen, tegen betaling van $4 licentiekosten. Helemaal niet prijzig!
Aan de andere kant vind ik dat de website momenteel adverteert met volledige ondersteuning voor O/S'en tot en met Windows 8
en OS X 10.8 Mountain Lion
. Dat is meer dan 4 jaar geleden. Zou PDFtk verouderd kunnen zijn? Ik vermoed van niet, maar ik weet het niet.