Sehr geehrter Hr. Prof. Flatscher,

 

vielen Dank für Ihre schnellen Rückmeldungen.

Ich werde das über die Zeichensätze in meiner Arbeit berücksichtigen.

 

Mit freundlichen Grüßen,

Sabrina Oppermann

 

From: Rony G. Flatscher <Rony.Flatscher@wu.ac.at>
Sent: Dienstag, 8. November 2022 15:42
To: Oppermann, Sabrina <sabrina.oppermann@s.wu.ac.at>
Subject: Re: [Wise2022w] BIS-Seminararbeit: Codepage

 

Liebe Frau Oppermann,

On 08.11.2022 15:38, Oppermann, Sabrina wrote:

also ich habe mal das verkehrte Omega gegoogelt und es ist anscheinend Teil des Afrika-Alphabets. Ich nehme an, dass dieses eine andere Codepage benötigt als wir haben.

wenn der Zeichensatz ein 8-Bit-Zeichensatz wie die Western Windows codepage 1252 ist, dann gibt es insgesamt etwas weniger als 256 Zeichen, die damit dargestellt werden können. Die Frage ist dann, welche Zeichen dargestellt werden können und wenn ein Zeichen nicht in 1252 dargestellt werden kann, ob und wie das Unicode-Zeichen nach 1252 übersetzt wird. In Ihrem Fall ist es ziemlich angenähert... :)



Der Wert des TextEncodings beträgt 1252.

Ja, das dachte ich mir. Wäre es 65001 (die Microsoft Codepage für UTF-8), dann würde Ihr Word UTF-8-Texte entgegennehmen können, so werden die einzelnen Zeichen uninterpretiert entgegengenommen und mit 1252 am Bildschirm dargestellt.

Mit freundlichem Gruß

Rony G. Flatscher

 

 

From: Rony G. Flatscher <Rony.Flatscher@wu.ac.at>
Sent: Dienstag, 8. November 2022 15:24
To: Oppermann, Sabrina <sabrina.oppermann@s.wu.ac.at>
Subject: Re: [Wise2022w] BIS-Seminararbeit: Codepage

 

Liebe Frau Oppermann,

On 08.11.2022 15:22, Oppermann, Sabrina wrote:

vielen Dank für Ihre Hilfe. Der Text konnte mit Ihrer Anweisung größtenteils richtig übertragen werden:

 

Kraków (Polish pronunciation: [krakuf]  listen), also spelled Krakow or Cracow (English pronunciation: /?kræka?/ listen), is the 2nd largest and one of the oldest cities in Poland and a popular tourist destination.  Its historic center was inscribed on the list of World Heritage Sites as the first of its kind.

Sehr fein.


 Jedoch entspricht das in fett-gedruckte Wort trotzdem nicht dem Original (ˈkrækaʊ). Kann man das noch ändern oder ist das nicht möglich?

Was glauben Sie, und warum? :)

Bitte schicken Sie auch die Ausgabe des Programms, also den Wert für TextEncoding!

Mit freundlichem Gruß

Rony G. Flatscher

 

 

From: Wise2022w <wise2022w-bounces@alice.wu.ac.at> On Behalf Of Rony G. Flatscher
Sent: Dienstag, 8. November 2022 12:38
To: wise2022w@alice.wu.ac.at
Subject: Re: [Wise2022w] BIS-Seminararbeit: Codepage

 

Liebe Frau Oppermann,

On 07.11.2022 14:19, Oppermann, Sabrina wrote:

ich habe schon verschiedene Codepages ausprobiert (437, 819, 850, 923, 1208, 37, 1140, 1051, 285, 1146), jedoch hat keines von denen als Ausgangs-Codepage funktioniert. (Weiter unten habe ich Ihnen noch den Code eingefügt)

 

Den uncodierten Text habe ich von einer Webseite nach Word importiert. Er wird dann genau so und ohne Sonderzeichen im Dokument angezeigt.

 

Den Foliensatz hatte ich bereits unter dem neuen Link von Business Programming 1 gefunden. Trotzdem habe ich bisher leider keine Lösung finden können… .

 

1    /*using curl*/

2    url=https://list.ly/list/m-best-european-cities-to-visit/

3    command= "curl" url

4    outArr=.array~new

5    errArr=.array~new

6    ADDRESS SYSTEM command WITH OUTPUT USING (outArr) ERROR USING (errArr)

7    html=outArr~makeString

8    /*get content*/

9    PARSE VAR html '<h2 class="ly-item-title" title="Krakow">' . '<div  
     class="item_note wbreak ly-markdown"><p>' content '</p>'

10   say content

11  

12   /*open MS Word*/

13   word= .oleobject~new("Word.Application")

14   word~visible=.true

15   NewDocument=word~Documents~add

Fügen Sie ein:

    say "textEncoding:" newDocument~textEncoding

16  

17   /*insert content in MS Word*/

18   SelectionObj=word~Selection

19   SelectionObj~TypeText(content)

20   SelectionObj~TypeParagraph

21   newcontent=bsf.iconv(content, "cp437","utf-8")

Da die Daten in UTF-8 kommen und Ihr Word wahrscheinlich cp1252 hat, sollte Zeile 21 wie folgt lauten:

    newContent=bsf.iconv(content, "utf-8", "cp1252")

 

22   SelectionObj~TypeText(newcontent)

23   --437, 819, 850, 923, 1208, 37, 1140, 1051, 285, 1146,

24  

25   ::requires "BSF.CLS"

26  

 

Bitte lassen Sie uns wissen, ob dies das Problem lösen hilft.

Mit freundlichem Gruß

Rony G. Flatscher

 

 

 

 

From: Wise2022w <wise2022w-bounces@alice.wu.ac.at> On Behalf Of Rony G. Flatscher
Sent: Montag, 7. November 2022 13:48
To: wise2022w@alice.wu.ac.at
Subject: Re: [Wise2022w] BIS-Seminararbeit: Codepage

 

Liebe Frau Oppermann,

On 07.11.2022 09:52, Oppermann, Sabrina wrote:

ich probiere mich gerade an dem Nutshell example, bei dem ich einen Text von einer Webpage in ein Word Dokument kopiere. Nun möchte ich die Codierung auf UTF-8 ändern, damit die Sonderzeichen ebenfalls angezeigt werden. Jedoch funktioniert der Befehl

bsf.iconv(text, from_codepage, to_codepage)

nicht.

Ich denke, dass ich nicht die richtige Ausgangs-Codepage eingegeben habe.

Welche Codepages haben Sie denn angegeben? :)

Im Folgendem den uncodierten Text:

 

Kraków (Polish pronunciation: [krakuf]  listen), also spelled Krakow or Cracow (English pronunciation: /ˈkrækaÊŠ/ listen), is the 2nd largest and one of the oldest cities in Poland and a popular tourist destination.  Its historic center was inscribed on the list of World Heritage Sites as the first of its kind.

Woher haben Sie diesen, aus der Kommandozeile? Wenn ja, haben Sie die Codepage im Kommandozeilenfenster auf UTF-8 geändert? (Hinweis: selbst dann kann es sein, dass manche Glyphen nicht korrekt unter Windows angezeigt werden.)






Wo kann ich die richtige Ausgangscodepage dieses Textes finden (falls es daran liegt)?

das ist bei MS-Word gar nicht so einfach, daher gibt es seit einiger Zeit einen eigenen Foliensatz dafür auf <https://wi.wu.ac.at/rgf/wu/lehre/autojava/material/foils/>, nämlich "300_Codepages_V02.pdf". Damit sollte es Ihnen möglich werden, das Problem zu lösen.

Mit freundlichem Gruß

Rony G. Flatscher

-- 
--
__________________________________________________________________________________
 
Prof. Dr. Rony G. Flatscher
Department Wirtschaftsinformatik und Operations Management
Institut für Wirtschaftsinformatik und Gesellschaft
D2c 2.086
WU Wien
Welthandelsplatz 1
A-1020  Wien/Vienna, Austria/Europe
 
http://www.wu.ac.at
__________________________________________________________________________________
 
 
 
 
 





-- 
--
__________________________________________________________________________________
 
Prof. Dr. Rony G. Flatscher
Department Wirtschaftsinformatik und Operations Management
Institut für Wirtschaftsinformatik und Gesellschaft
D2c 2.086
WU Wien
Welthandelsplatz 1
A-1020  Wien/Vienna, Austria/Europe
 
http://www.wu.ac.at
__________________________________________________________________________________
 
 
 
 
 




-- 
--
__________________________________________________________________________________
 
Prof. Dr. Rony G. Flatscher
Department Wirtschaftsinformatik und Operations Management
Institut für Wirtschaftsinformatik und Gesellschaft
D2c 2.086
WU Wien
Welthandelsplatz 1
A-1020  Wien/Vienna, Austria/Europe
 
http://www.wu.ac.at
__________________________________________________________________________________
 
 
 
 
 
-- 
--
__________________________________________________________________________________
 
Prof. Dr. Rony G. Flatscher
Department Wirtschaftsinformatik und Operations Management
Institut für Wirtschaftsinformatik und Gesellschaft
D2c 2.086
WU Wien
Welthandelsplatz 1
A-1020  Wien/Vienna, Austria/Europe
 
http://www.wu.ac.at
__________________________________________________________________________________