test: consolidate utf8 text fixtures in tests

We previously used a text that appears to be an excerpt of
https://zh.wikipedia.org/wiki/%E5%8D%97%E8%B6%8A%E5%9B%BD
and can have copyright/license complications. It may
also include some geopolitical nuances. The text has been
repeated through out the code base without much reuse.

This patch consolidates the fixtures by adding a common helper
string as `fixtures.utf8TestText` which is identical to a copy
in test/fixtures/utf8_test_text.txt. It also updates the text
to a copy of 蘭亭集序, It was chosen because:

1. It's a well-known Chinese classical piece written in 353 CE
   and therefore in public domain. The string is copied from
   https://zh.wikisource.org/zh-hant/%E8%98%AD%E4%BA%AD%E9%9B%86%E5%BA%8F
   which contains a disclaimer of copyright for this reason.
2. The text is in suitable length for general UTF8 string
   read/write tests (including punctuations, 389 code points and
   1167 bytes).
3. This is also commonly used as reference text for Chinese text
   layout tests.
4. It's a timeless and harmless preface for a collection of poems,
   written by a uncontroversial figure who passed away >1600 years
   ago and contains no geopolitical nuances. Background and an
   English translation of this text can be found at
   https://en.wikipedia.org/wiki/Lantingji_Xu

PR-URL: https://github.com/nodejs/node/pull/50732
Reviewed-By: Yagiz Nizipli <yagiz.nizipli@sentry.io>
This commit is contained in:
Joyee Cheung 2023-11-28 18:18:02 +01:00 committed by GitHub
parent 69866bf1b6
commit 97c29def52
No known key found for this signature in database
GPG Key ID: 4AEE18F83AFDEB23
8 changed files with 34 additions and 55 deletions

View File

@ -28,6 +28,23 @@ function readFixtureKeys(enc, ...names) {
return names.map((name) => readFixtureKey(name, enc));
}
// This should be in sync with test/fixtures/utf8_test_text.txt.
// We copy them here as a string because this is supposed to be used
// in fs API tests.
const utf8TestText = '永和九年,嵗在癸丑,暮春之初,會於會稽山隂之蘭亭,脩稧事也。' +
'羣賢畢至,少長咸集。此地有崇山峻領,茂林脩竹;又有清流激湍,' +
'暎帶左右。引以為流觴曲水,列坐其次。雖無絲竹管弦之盛,一觴一詠,' +
'亦足以暢敘幽情。是日也,天朗氣清,恵風和暢;仰觀宇宙之大,' +
'俯察品類之盛;所以遊目騁懐,足以極視聽之娛,信可樂也。夫人之相與,' +
'俯仰一世,或取諸懐抱,悟言一室之內,或因寄所託,放浪形骸之外。' +
'雖趣舎萬殊,靜躁不同,當其欣扵所遇,暫得扵己,怏然自足,' +
'不知老之將至。及其所之既惓,情隨事遷,感慨係之矣。向之所欣,' +
'俛仰之閒以為陳跡,猶不能不以之興懐;況脩短隨化,終期扵盡。' +
'古人云:「死生亦大矣。」豈不痛哉!每攬昔人興感之由,若合一契,' +
'未嘗不臨文嗟悼,不能喻之扵懐。固知一死生為虛誕,齊彭殤為妄作。' +
'後之視今,亦由今之視昔,悲夫!故列敘時人,錄其所述,雖世殊事異,' +
'所以興懐,其致一也。後之攬者,亦將有感扵斯文。';
module.exports = {
fixturesDir,
path: fixturesPath,
@ -35,4 +52,8 @@ module.exports = {
readSync: readFixtureSync,
readKey: readFixtureKey,
readKeys: readFixtureKeys,
utf8TestText,
get utf8TestTextPath() {
return fixturesPath('utf8_test_text.txt');
},
};

1
test/fixtures/utf8_test_text.txt vendored Normal file
View File

@ -0,0 +1 @@
永和九年,嵗在癸丑,暮春之初,會於會稽山隂之蘭亭,脩稧事也。羣賢畢至,少長咸集。此地有崇山峻領,茂林脩竹;又有清流激湍,暎帶左右。引以為流觴曲水,列坐其次。雖無絲竹管弦之盛,一觴一詠,亦足以暢敘幽情。是日也,天朗氣清,恵風和暢;仰觀宇宙之大,俯察品類之盛;所以遊目騁懐,足以極視聽之娛,信可樂也。夫人之相與,俯仰一世,或取諸懐抱,悟言一室之內,或因寄所託,放浪形骸之外。雖趣舎萬殊,靜躁不同,當其欣扵所遇,暫得扵己,怏然自足,不知老之將至。及其所之既惓,情隨事遷,感慨係之矣。向之所欣,俛仰之閒以為陳跡,猶不能不以之興懐;況脩短隨化,終期扵盡。古人云:「死生亦大矣。」豈不痛哉!每攬昔人興感之由,若合一契,未嘗不臨文嗟悼,不能喻之扵懐。固知一死生為虛誕,齊彭殤為妄作。後之視今,亦由今之視昔,悲夫!故列敘時人,錄其所述,雖世殊事異,所以興懐,其致一也。後之攬者,亦將有感扵斯文。

View File

@ -27,15 +27,10 @@ const fs = require('fs');
const currentFileData = 'ABCD';
const m = 0o600;
const num = 220;
const data = '南越国是前203年至前111年存在于岭南地区的一个国家国都位于番禺疆域包括今天中国的广东、' +
'广西两省区的大部份地区,福建省、湖南、贵州、云南的一小部份地区和越南的北部。' +
'南越国是秦朝灭亡后由南海郡尉赵佗于前203年起兵兼并桂林郡和象郡后建立。' +
'前196年和前179年南越国曾先后两次名义上臣属于西汉成为西汉的“外臣”。前112年' +
'南越国末代君主赵建德与西汉发生战争被汉武帝于前111年所灭。南越国共存在93年' +
'历经五代君主。南越国是岭南地区的第一个有记载的政权国家,采用封建制和郡县制并存的制度,' +
'它的建立保证了秦末乱世岭南地区社会秩序的稳定,有效的改善了岭南地区落后的政治、##济现状。\n';
const tmpdir = require('../common/tmpdir');
const fixtures = require('../common/fixtures');
const data = fixtures.utf8TestText;
tmpdir.refresh();
// Test that empty file will be created and have content added.

View File

@ -27,14 +27,8 @@ const fs = require('fs');
const tmpdir = require('../common/tmpdir');
const currentFileData = 'ABCD';
const s = '南越国是前203年至前111年存在于岭南地区的一个国家国都位于番禺疆域包括今天中国的广东、' +
'广西两省区的大部份地区,福建省、湖南、贵州、云南的一小部份地区和越南的北部。' +
'南越国是秦朝灭亡后由南海郡尉赵佗于前203年起兵兼并桂林郡和象郡后建立。' +
'前196年和前179年南越国曾先后两次名义上臣属于西汉成为西汉的“外臣”。前112年' +
'南越国末代君主赵建德与西汉发生战争被汉武帝于前111年所灭。南越国共存在93年' +
'历经五代君主。南越国是岭南地区的第一个有记载的政权国家,采用封建制和郡县制并存的制度,' +
'它的建立保证了秦末乱世岭南地区社会秩序的稳定,有效的改善了岭南地区落后的政治、##济现状。\n';
const fixtures = require('../common/fixtures');
const s = fixtures.utf8TestText;
tmpdir.refresh();

View File

@ -7,14 +7,8 @@ const tmpdir = require('../common/tmpdir');
tmpdir.refresh();
const filename = tmpdir.resolve('test.txt');
const s = '南越国是前203年至前111年存在于岭南地区的一个国家国都位于番禺疆域包括今天中国的广东、' +
'广西两省区的大部份地区,福建省、湖南、贵州、云南的一小部份地区和越南的北部。' +
'南越国是秦朝灭亡后由南海郡尉赵佗于前203年起兵兼并桂林郡和象郡后建立。' +
'前196年和前179年南越国曾先后两次名义上臣属于西汉成为西汉的“外臣”。前112年' +
'南越国末代君主赵建德与西汉发生战争被汉武帝于前111年所灭。南越国共存在93年' +
'历经五代君主。南越国是岭南地区的第一个有记载的政权国家,采用封建制和郡县制并存的制度,' +
'它的建立保证了秦末乱世岭南地区社会秩序的稳定,有效的改善了岭南地区落后的政治、##济现状。\n';
const fixtures = require('../common/fixtures');
const s = fixtures.utf8TestText;
// The length of the buffer should be a multiple of 8
// as required by common.getArrayBufferViews()

View File

@ -28,14 +28,8 @@ const tmpdir = require('../common/tmpdir');
tmpdir.refresh();
const filename = tmpdir.resolve('test.txt');
const s = '南越国是前203年至前111年存在于岭南地区的一个国家国都位于番禺疆域包括今天中国的广东、' +
'广西两省区的大部份地区,福建省、湖南、贵州、云南的一小部份地区和越南的北部。' +
'南越国是秦朝灭亡后由南海郡尉赵佗于前203年起兵兼并桂林郡和象郡后建立。' +
'前196年和前179年南越国曾先后两次名义上臣属于西汉成为西汉的“外臣”。前112年' +
'南越国末代君主赵建德与西汉发生战争被汉武帝于前111年所灭。南越国共存在93年' +
'历经五代君主。南越国是岭南地区的第一个有记载的政权国家,采用封建制和郡县制并存的制度,' +
'它的建立保证了秦末乱世岭南地区社会秩序的稳定,有效的改善了岭南地区落后的政治、##济现状。\n';
const fixtures = require('../common/fixtures');
const s = fixtures.utf8TestText;
fs.writeFile(filename, s, common.mustSucceed(() => {
fs.readFile(filename, common.mustSucceed((buffer) => {

View File

@ -23,16 +23,8 @@
const common = require('../common');
const assert = require('assert');
const http = require('http');
const UTF8_STRING = '南越国是前203年至前111年存在于岭南地区的一个国家' +
'国都位于番禺,疆域包括今天中国的广东、广西两省区的大部份地区,福建省、湖南、' +
'贵州、云南的一小部份地区和越南的北部。南越国是秦朝灭亡后,' +
'由南海郡尉赵佗于前203年起兵兼并桂林郡和象郡后建立。前196年和前179年' +
'南越国曾先后两次名义上臣属于西汉成为西汉的“外臣”。前112年' +
'南越国末代君主赵建德与西汉发生战争被汉武帝于前111年所灭。' +
'南越国共存在93年历经五代君主。南越国是岭南地区的第一个有记载的政权国家' +
'采用封建制和郡县制并存的制度,它的建立保证了秦末乱世岭南地区社会秩序的稳定,' +
'有效的改善了岭南地区落后的政治、经济现状。';
const fixtures = require('../common/fixtures');
const UTF8_STRING = fixtures.utf8TestText;
const server = http.createServer(common.mustCall((req, res) => {
res.writeHead(200, { 'Content-Type': 'text/plain; charset=utf8' });

View File

@ -8,22 +8,10 @@ const fs = require('fs');
const stdoutScript = fixtures.path('echo-close-check.js');
const tmpFile = tmpdir.resolve('stdin.txt');
const string = fixtures.utf8TestText;
const cmd = `"${process.argv[0]}" "${stdoutScript}" < "${tmpFile}"`;
const string = 'abc\nümlaut.\nsomething else\n' +
'南越国是前203年至前111年存在于岭南地区的一个国家国都位于番禺' +
'疆域包括今天中国的广东、广西两省区的大部份地区,福建省、湖南、贵州、' +
'云南的一小部份地区和越南的北部。南越国是秦朝灭亡后,' +
'由南海郡尉赵佗于前203年起兵兼并桂林郡和象郡后建立。前196年和前179年' +
'南越国曾先后两次名义上臣属于西汉成为西汉的“外臣”。前112年' +
'南越国末代君主赵建德与西汉发生战争被汉武帝于前111年所灭。南越国共存在93年' +
'历经五代君主。南越国是岭南地区的第一个有记载的政权国家,' +
'采用封建制和郡县制并存的制度,' +
'它的建立保证了秦末乱世岭南地区社会秩序的稳定,' +
'有效的改善了岭南地区落后的政治、##济现状。\n';
tmpdir.refresh();
console.log(`${cmd}\n\n`);