2009-08-11 13:11:38 +0000 2009-08-11 13:11:38 +0000
26
26

Hoe kan ik Unicode-tekst bewerken in Notepad++?

Soms bewerk ik Engelse tekst die Unicode-tekens bevat. Om de een of andere reden, op mijn PC, converteert Notepad++ Unicode karakters naar ???‘s waardoor de tekst beschadigd wordt en al die gegevens verloren gaan. Ik ben op zoek naar een manier om dergelijke tekst te bewerken, met behoud van Unicode-tekens. Ik gebruik Consolas als mijn lettertype. Als het lettertype niet al die tekens heeft, waarom zou ik dan de gegevens verliezen als ik de tekst uit Notepad++ kopieer (via Windows’ klembord)?

Antwoorden (5)

15
15
15
2011-09-17 11:54:32 +0000

Het in de vraag beschreven probleem doet zich voor wanneer een leeg/nieuw document is ingesteld op “ANSI”, en er Unicode tekens in worden geplakt.

Er is geen auto-detectie bij gebruik met een leeg/nieuw document, tenminste niet in de versie van Notepad++ waarop ik het getest heb (v5.4.5). “ANSI” is de standaard in Notepad++ voor een nieuw document, tenzij ingesteld in menu SettingsPreferences → tab New Document/Open Save Directory.

Oplossing

De oplossing is om de codering op UTF-8 te zetten voordat u plakt, menu FormaatEncodeer in UTF-8:

Voorbeeld

Ik heb wat tekst gekopieerd naar een nieuw Notepad++ document, Russisch (русский язык, russkiy yazyk), van Firefox dat de Wikipedia pagina Russische taal _ laat zien.

Als de codering niet gewijzigd is van “ANSI” is dit het resultaat:

Als de codering wel gewijzigd is, is dit het resultaat:

Zoals te zien is in de figuur hieronder (het Cyrillisch gedeelte is gemarkeerd), converteert Notepad++ de Unicode karakters in ASCII 63 (hexadecimaal 3F), vraagtekens. Daarom gaan de Unicode-tekens verloren (in “ANSI” modus) wanneer de tekst via het klembord wordt gekopieerd (het is geen probleem met het lettertype - er gaat informatie verloren).

Getest op: Notepad++ v5.4.5 (UNICODE).

15
15
15
2009-08-11 13:30:37 +0000

Als het bestand werkelijk in Unicode is gecodeerd, zou Notepad++ dat automatisch moeten detecteren. Het Consolas font werkt goed voor mij. Je kunt een van deze twee menu-opties proberen:

  • Encoding -> Encode in UTF-8
  • Encoding -> Convert to UTF-8

Ik ben er vrij zeker van dat de eerste zal doen wat je wilt.

5
5
5
2009-08-11 13:30:46 +0000

Er is goed nieuws en er is slecht nieuws.

Goed nieuws: Notepad++ ondersteunt Unicode (althans voor zover ik kan nagaan).

Slecht nieuws: Blijkbaar is Unicode ondersteuning alleen op Windows XP.

Ik heb eigenlijk geen Windows machine voor me. Van wat ik me herinner, is er ergens een menu Codering onder het menu Formatteren. De codering voor Unicode is eigenlijk meestal UTF-8.

Hier is een ‘mooi’ plaatje van Unicode ondersteuning in Notepad++,

1
1
1
2015-04-14 13:13:05 +0000

Dit werkte voor mij:

Ik heb het lettertype veranderd in Courier New in de stijlconfigurator op mijn PC (Windows 7 met Engels/US tekenset en Roemeens voor niet-Unicode set). Het werkt met Courier New & Tahoma fonts + UTF-8 encoding.

0
0
0
2018-09-19 10:12:31 +0000

In het menu bovenaan kiest u de Encoding en vervolgens Encode in UTF-8 of Encode in UTF-8 Without BOM dan kunt u tekst bewerken in Unicode codering.