Het in de vraag beschreven probleem doet zich voor wanneer een leeg/nieuw document is ingesteld op “ANSI”, en er Unicode tekens in worden geplakt.
Er is geen auto-detectie bij gebruik met een leeg/nieuw document, tenminste niet in de versie van Notepad++ waarop ik het getest heb (v5.4.5). “ANSI” is de standaard in Notepad++ voor een nieuw document, tenzij ingesteld in menu Settings → Preferences → tab New Document/Open Save Directory.
Oplossing
De oplossing is om de codering op UTF-8 te zetten voordat u plakt, menu Formaat → Encodeer in UTF-8:
Voorbeeld
Ik heb wat tekst gekopieerd naar een nieuw Notepad++ document, Russisch (русский язык, russkiy yazyk), van Firefox dat de Wikipedia pagina Russische taal _ laat zien.
Als de codering niet gewijzigd is van “ANSI” is dit het resultaat:
Als de codering wel gewijzigd is, is dit het resultaat:
Zoals te zien is in de figuur hieronder (het Cyrillisch gedeelte is gemarkeerd), converteert Notepad++ de Unicode karakters in ASCII 63 (hexadecimaal 3F), vraagtekens. Daarom gaan de Unicode-tekens verloren (in “ANSI” modus) wanneer de tekst via het klembord wordt gekopieerd (het is geen probleem met het lettertype - er gaat informatie verloren).
Getest op: Notepad++ v5.4.5 (UNICODE).