Sehr geehrter Hr. Prof. Flatscher,
liebe MitstudentInnen,
im Anhang finden Sie meine Power Point Präsentation für die morgige Einheit.
Mit freundlichen Grüßen,
Sabrina Oppermann
Sehr geehrter Herr Professor Flatscher, liebe Kollegen,
im Anhang finden Sie meine Zwischenpräsentation zum Thema HTML.
Mit freundlichen Grüßen
Martina Oppermann
Sehr geehrter Herr Professor Flatscher, liebe KollegInnen,
im Anhang befindet sich meine 3. Zwischenpräsentation.
Mit freundlichen Grüßen
Fabian Blauensteiner
Sehr geehrter Hr. Prof. Flatscher,
liebe MitstudentInnen,
im Anhang finden Sie meine Präsentation für die morgige Einheit.
Mit freundlichen Grüßen,
Sabrina Oppermann
Sehr geehrter Hr. Prof. Flatscher,
vielen Dank für Ihre schnellen Rückmeldungen.
Ich werde das über die Zeichensätze in meiner Arbeit berücksichtigen.
Mit freundlichen Grüßen,
Sabrina Oppermann
From: Rony G. Flatscher <Rony.Flatscher(a)wu.ac.at>
Sent: Dienstag, 8. November 2022 15:42
To: Oppermann, Sabrina <sabrina.oppermann(a)s.wu.ac.at>
Subject: Re: [Wise2022w] BIS-Seminararbeit: Codepage
Liebe Frau Oppermann,
On 08.11.2022 15:38, Oppermann, Sabrina wrote:
also ich habe mal das verkehrte Omega gegoogelt und es ist anscheinend Teil des Afrika-Alphabets. Ich nehme an, dass dieses eine andere Codepage benötigt als wir haben.
wenn der Zeichensatz ein 8-Bit-Zeichensatz wie die Western Windows codepage 1252 ist, dann gibt es insgesamt etwas weniger als 256 Zeichen, die damit dargestellt werden können. Die Frage ist dann, welche Zeichen dargestellt werden können und wenn ein Zeichen nicht in 1252 dargestellt werden kann, ob und wie das Unicode-Zeichen nach 1252 übersetzt wird. In Ihrem Fall ist es ziemlich angenähert... :)
Der Wert des TextEncodings beträgt 1252.
Ja, das dachte ich mir. Wäre es 65001 (die Microsoft Codepage für UTF-8), dann würde Ihr Word UTF-8-Texte entgegennehmen können, so werden die einzelnen Zeichen uninterpretiert entgegengenommen und mit 1252 am Bildschirm dargestellt.
Mit freundlichem Gruß
Rony G. Flatscher
From: Rony G. Flatscher <Rony.Flatscher(a)wu.ac.at><mailto:Rony.Flatscher@wu.ac.at>
Sent: Dienstag, 8. November 2022 15:24
To: Oppermann, Sabrina <sabrina.oppermann(a)s.wu.ac.at><mailto:sabrina.oppermann@s.wu.ac.at>
Subject: Re: [Wise2022w] BIS-Seminararbeit: Codepage
Liebe Frau Oppermann,
On 08.11.2022 15:22, Oppermann, Sabrina wrote:
vielen Dank für Ihre Hilfe. Der Text konnte mit Ihrer Anweisung größtenteils richtig übertragen werden:
Kraków (Polish pronunciation: [krakuf] listen), also spelled Krakow or Cracow (English pronunciation: /?kræka?/ listen), is the 2nd largest and one of the oldest cities in Poland and a popular tourist destination. Its historic center was inscribed on the list of World Heritage Sites as the first of its kind.
Sehr fein.
Jedoch entspricht das in fett-gedruckte Wort trotzdem nicht dem Original (ˈkrækaʊ). Kann man das noch ändern oder ist das nicht möglich?
Was glauben Sie, und warum? :)
Bitte schicken Sie auch die Ausgabe des Programms, also den Wert für TextEncoding!
Mit freundlichem Gruß
Rony G. Flatscher
From: Wise2022w <wise2022w-bounces(a)alice.wu.ac.at><mailto:wise2022w-bounces@alice.wu.ac.at> On Behalf Of Rony G. Flatscher
Sent: Dienstag, 8. November 2022 12:38
To: wise2022w(a)alice.wu.ac.at<mailto:wise2022w@alice.wu.ac.at>
Subject: Re: [Wise2022w] BIS-Seminararbeit: Codepage
Liebe Frau Oppermann,
On 07.11.2022 14:19, Oppermann, Sabrina wrote:
ich habe schon verschiedene Codepages ausprobiert (437, 819, 850, 923, 1208, 37, 1140, 1051, 285, 1146), jedoch hat keines von denen als Ausgangs-Codepage funktioniert. (Weiter unten habe ich Ihnen noch den Code eingefügt)
Den uncodierten Text habe ich von einer Webseite nach Word importiert. Er wird dann genau so und ohne Sonderzeichen im Dokument angezeigt.
Den Foliensatz hatte ich bereits unter dem neuen Link von Business Programming 1 gefunden. Trotzdem habe ich bisher leider keine Lösung finden können… .
1 /*using curl*/
2 url=https://list.ly/list/m-best-european-cities-to-visit/
3 command= "curl" url
4 outArr=.array~new
5 errArr=.array~new
6 ADDRESS SYSTEM command WITH OUTPUT USING (outArr) ERROR USING (errArr)
7 html=outArr~makeString
8 /*get content*/
9 PARSE VAR html '<h2 class="ly-item-title" title="Krakow">' . '<div
class="item_note wbreak ly-markdown"><p>' content '</p>'
10 say content
11
12 /*open MS Word*/
13 word= .oleobject~new("Word.Application")
14 word~visible=.true
15 NewDocument=word~Documents~add
Fügen Sie ein:
say "textEncoding:" newDocument~textEncoding
16
17 /*insert content in MS Word*/
18 SelectionObj=word~Selection
19 SelectionObj~TypeText(content)
20 SelectionObj~TypeParagraph
21 newcontent=bsf.iconv(content, "cp437","utf-8")
Da die Daten in UTF-8 kommen und Ihr Word wahrscheinlich cp1252 hat, sollte Zeile 21 wie folgt lauten:
newContent=bsf.iconv(content, "utf-8", "cp1252")
22 SelectionObj~TypeText(newcontent)
23 --437, 819, 850, 923, 1208, 37, 1140, 1051, 285, 1146,
24
25 ::requires "BSF.CLS"
26
Bitte lassen Sie uns wissen, ob dies das Problem lösen hilft.
Mit freundlichem Gruß
Rony G. Flatscher
From: Wise2022w <wise2022w-bounces(a)alice.wu.ac.at><mailto:wise2022w-bounces@alice.wu.ac.at> On Behalf Of Rony G. Flatscher
Sent: Montag, 7. November 2022 13:48
To: wise2022w(a)alice.wu.ac.at<mailto:wise2022w@alice.wu.ac.at>
Subject: Re: [Wise2022w] BIS-Seminararbeit: Codepage
Liebe Frau Oppermann,
On 07.11.2022 09:52, Oppermann, Sabrina wrote:
ich probiere mich gerade an dem Nutshell example, bei dem ich einen Text von einer Webpage in ein Word Dokument kopiere. Nun möchte ich die Codierung auf UTF-8 ändern, damit die Sonderzeichen ebenfalls angezeigt werden. Jedoch funktioniert der Befehl
bsf.iconv(text, from_codepage, to_codepage)
nicht.
Ich denke, dass ich nicht die richtige Ausgangs-Codepage eingegeben habe.
Welche Codepages haben Sie denn angegeben? :)
Im Folgendem den uncodierten Text:
Kraków (Polish pronunciation: [krakuf] listen), also spelled Krakow or Cracow (English pronunciation: /ˈkrækaʊ/ listen), is the 2nd largest and one of the oldest cities in Poland and a popular tourist destination. Its historic center was inscribed on the list of World Heritage Sites as the first of its kind.
Woher haben Sie diesen, aus der Kommandozeile? Wenn ja, haben Sie die Codepage im Kommandozeilenfenster auf UTF-8 geändert? (Hinweis: selbst dann kann es sein, dass manche Glyphen nicht korrekt unter Windows angezeigt werden.)
Wo kann ich die richtige Ausgangscodepage dieses Textes finden (falls es daran liegt)?
das ist bei MS-Word gar nicht so einfach, daher gibt es seit einiger Zeit einen eigenen Foliensatz dafür auf <https://wi.wu.ac.at/rgf/wu/lehre/autojava/material/foils/><https://wi.wu.ac.at/rgf/wu/lehre/autojava/material/foils/>, nämlich "300_Codepages_V02.pdf". Damit sollte es Ihnen möglich werden, das Problem zu lösen.
Mit freundlichem Gruß
Rony G. Flatscher
--
--
__________________________________________________________________________________
Prof. Dr. Rony G. Flatscher
Department Wirtschaftsinformatik und Operations Management
Institut für Wirtschaftsinformatik und Gesellschaft
D2c 2.086
WU Wien
Welthandelsplatz 1
A-1020 Wien/Vienna, Austria/Europe
http://www.wu.ac.at
__________________________________________________________________________________
--
--
__________________________________________________________________________________
Prof. Dr. Rony G. Flatscher
Department Wirtschaftsinformatik und Operations Management
Institut für Wirtschaftsinformatik und Gesellschaft
D2c 2.086
WU Wien
Welthandelsplatz 1
A-1020 Wien/Vienna, Austria/Europe
http://www.wu.ac.at
__________________________________________________________________________________
--
--
__________________________________________________________________________________
Prof. Dr. Rony G. Flatscher
Department Wirtschaftsinformatik und Operations Management
Institut für Wirtschaftsinformatik und Gesellschaft
D2c 2.086
WU Wien
Welthandelsplatz 1
A-1020 Wien/Vienna, Austria/Europe
http://www.wu.ac.at
__________________________________________________________________________________
--
--
__________________________________________________________________________________
Prof. Dr. Rony G. Flatscher
Department Wirtschaftsinformatik und Operations Management
Institut für Wirtschaftsinformatik und Gesellschaft
D2c 2.086
WU Wien
Welthandelsplatz 1
A-1020 Wien/Vienna, Austria/Europe
http://www.wu.ac.at
__________________________________________________________________________________