2011-04-24 07:36:29 +0000 2011-04-24 07:36:29 +0000
155
155

Hoe kan ik het bestandstype bepalen zonder extensie op Windows?

Ik krijg soms bestanden van mijn klanten die de verkeerde bestandsextensie hebben. Bijvoorbeeld, de naam is image.jpg maar het bestand is eigenlijk een TIFF afbeelding. In veel gevallen kan ik dit ophelderen door het bestand in een teksteditor te openen, naar de eerste paar bytes te kijken en dan af te leiden welk bestandstype het is.

Dit werkt voor mij met JPEG, TIFF, GIF en PDF bestanden. Er zijn echter veel meer bestandstypen.

Is het mogelijk om de identificatie van het juiste bestandstype te automatiseren door de gegevens die het bevat te analyseren?

Antwoorden (5)

147
147
147
2011-04-24 07:47:21 +0000

U kunt de TrID tool gebruiken, die een groeiende bibliotheek van bestandstype definities heeft om bestanden mee te identificeren.

Wildcards worden ondersteund, dus in uw voorbeeld kunt u alle te onderzoeken afbeeldingen in een map zetten, bijvoorbeeld C:\verifyimages - dan kunt u het commando gebruiken:

trid C:\verifyimages\*

Dit zal alle bestanden in de map verifyimages onderzoeken.

  • *

Er is ook een GUI-versie beschikbaar, TrIDNet :

Er is documentatie beschikbaar over hoe u TrID of TrIDNet eenvoudig kunt integreren in Windows Verkenner en Total Commander:

Windows Verkenner

Total Commander

53
53
53
2011-04-24 07:38:08 +0000

Bestand test elk argument in een poging het te classificeren. Er zijn drie reeksen tests, die in deze volgorde worden uitgevoerd: bestandssysteemtests, magische getalstests, en taaltests. De eerste test die slaagt, zorgt ervoor dat het bestandstype wordt afgedrukt.

Het type dat wordt afgedrukt bevat meestal een van de woorden text (het bestand bevat alleen afdruktekens en een paar gewone controletekens en is waarschijnlijk veilig te lezen op een ASCII-terminal), executable (het bestand bevat het resultaat van het compileren van een programma in een vorm die begrijpelijk is voor een of andere UNIX-kernel), of data wat iets anders betekent (gegevens zijn meestal “binair” of niet-afdrukbaar). Uitzonderingen zijn bekende bestandsformaten (core files, tar archives) waarvan bekend is dat ze binaire gegevens bevatten.

14
14
14
2011-04-24 13:16:09 +0000

Ik heb gewerkt voor de Franse Nationale Bibliotheek, om een digitaal archiefsysteem te bouwen dat niet alleen gedigitaliseerde boeken bevat, maar ook miljoenen digitale artefacten met allerlei vreemde bestandstypen. We gebruikten JHOVE om bestandsformaten te herkennen.

JHOVE is open source, het wordt onderhouden door JSTOR en de Harvard University Library. Het is vrij eenvoudig om te gebruiken.

1
1
1
2018-06-04 11:24:55 +0000

U kunt het bestandstype op elke computer controleren, inclusief windows op http://www.checkfiletype.com

1
1
1
2011-04-24 11:30:15 +0000

Ik gebruik Oracle’s OutsideIn bibliotheken in mijn programma’s. Niet gratis, maar ze werken goed, vooral voor afbeeldingen. De market-speak zegt dat het meer dan 500 bestandstypes ondersteunt.