1
0

dstr.c 14 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578579580581582583584585586587588589590591592593594595596597598599600601602603604605606607608609610611612613614615616617618619620621622623624625626627628629630631632633634635636637638639640641642643644645646647648649650651652653654655656657658659660661662663664665666667668669670671672673674675676677678679680681682683684685686687688689690691692693694695696697698699700701702703704705706707708709710711712713714715716717718719720721722723724725726727728729730731732733734735736737738739740741742743744745746747748749750751752753754755756757758759760761762763764765766767768769770771772773774775776777778779780781782783784785786787788789790
  1. /*
  2. * Copyright (c) 2023 Lain Bailey <[email protected]>
  3. *
  4. * Permission to use, copy, modify, and distribute this software for any
  5. * purpose with or without fee is hereby granted, provided that the above
  6. * copyright notice and this permission notice appear in all copies.
  7. *
  8. * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
  9. * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
  10. * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
  11. * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
  12. * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
  13. * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
  14. * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
  15. */
  16. #include <stddef.h>
  17. #include <stdlib.h>
  18. #include <stdio.h>
  19. #include <string.h>
  20. #include <assert.h>
  21. #include <ctype.h>
  22. #include <wchar.h>
  23. #include <wctype.h>
  24. #include <limits.h>
  25. #include "c99defs.h"
  26. #include "dstr.h"
  27. #include "darray.h"
  28. #include "bmem.h"
  29. #include "utf8.h"
  30. #include "lexer.h"
  31. #include "platform.h"
  32. static const char *astrblank = "";
  33. static const wchar_t *wstrblank = L"";
  34. int astrcmpi(const char *str1, const char *str2)
  35. {
  36. if (!str1)
  37. str1 = astrblank;
  38. if (!str2)
  39. str2 = astrblank;
  40. do {
  41. char ch1 = (char)toupper(*str1);
  42. char ch2 = (char)toupper(*str2);
  43. if (ch1 < ch2)
  44. return -1;
  45. else if (ch1 > ch2)
  46. return 1;
  47. } while (*str1++ && *str2++);
  48. return 0;
  49. }
  50. int wstrcmpi(const wchar_t *str1, const wchar_t *str2)
  51. {
  52. if (!str1)
  53. str1 = wstrblank;
  54. if (!str2)
  55. str2 = wstrblank;
  56. do {
  57. wchar_t ch1 = (wchar_t)towupper(*str1);
  58. wchar_t ch2 = (wchar_t)towupper(*str2);
  59. if (ch1 < ch2)
  60. return -1;
  61. else if (ch1 > ch2)
  62. return 1;
  63. } while (*str1++ && *str2++);
  64. return 0;
  65. }
  66. int astrcmp_n(const char *str1, const char *str2, size_t n)
  67. {
  68. if (!n)
  69. return 0;
  70. if (!str1)
  71. str1 = astrblank;
  72. if (!str2)
  73. str2 = astrblank;
  74. do {
  75. char ch1 = *str1;
  76. char ch2 = *str2;
  77. if (ch1 < ch2)
  78. return -1;
  79. else if (ch1 > ch2)
  80. return 1;
  81. } while (*str1++ && *str2++ && --n);
  82. return 0;
  83. }
  84. int wstrcmp_n(const wchar_t *str1, const wchar_t *str2, size_t n)
  85. {
  86. if (!n)
  87. return 0;
  88. if (!str1)
  89. str1 = wstrblank;
  90. if (!str2)
  91. str2 = wstrblank;
  92. do {
  93. wchar_t ch1 = *str1;
  94. wchar_t ch2 = *str2;
  95. if (ch1 < ch2)
  96. return -1;
  97. else if (ch1 > ch2)
  98. return 1;
  99. } while (*str1++ && *str2++ && --n);
  100. return 0;
  101. }
  102. int astrcmpi_n(const char *str1, const char *str2, size_t n)
  103. {
  104. if (!n)
  105. return 0;
  106. if (!str1)
  107. str1 = astrblank;
  108. if (!str2)
  109. str2 = astrblank;
  110. do {
  111. char ch1 = (char)toupper(*str1);
  112. char ch2 = (char)toupper(*str2);
  113. if (ch1 < ch2)
  114. return -1;
  115. else if (ch1 > ch2)
  116. return 1;
  117. } while (*str1++ && *str2++ && --n);
  118. return 0;
  119. }
  120. int wstrcmpi_n(const wchar_t *str1, const wchar_t *str2, size_t n)
  121. {
  122. if (!n)
  123. return 0;
  124. if (!str1)
  125. str1 = wstrblank;
  126. if (!str2)
  127. str2 = wstrblank;
  128. do {
  129. wchar_t ch1 = (wchar_t)towupper(*str1);
  130. wchar_t ch2 = (wchar_t)towupper(*str2);
  131. if (ch1 < ch2)
  132. return -1;
  133. else if (ch1 > ch2)
  134. return 1;
  135. } while (*str1++ && *str2++ && --n);
  136. return 0;
  137. }
  138. char *astrstri(const char *str, const char *find)
  139. {
  140. size_t len;
  141. if (!str || !find)
  142. return NULL;
  143. len = strlen(find);
  144. do {
  145. if (astrcmpi_n(str, find, len) == 0)
  146. return (char *)str;
  147. } while (*str++);
  148. return NULL;
  149. }
  150. wchar_t *wstrstri(const wchar_t *str, const wchar_t *find)
  151. {
  152. size_t len;
  153. if (!str || !find)
  154. return NULL;
  155. len = wcslen(find);
  156. do {
  157. if (wstrcmpi_n(str, find, len) == 0)
  158. return (wchar_t *)str;
  159. } while (*str++);
  160. return NULL;
  161. }
  162. static inline bool is_padding(int ch)
  163. {
  164. return ch == ' ' || ch == '\t' || ch == '\n' || ch == '\r';
  165. }
  166. char *strdepad(char *str)
  167. {
  168. char *temp;
  169. size_t len;
  170. if (!str)
  171. return str;
  172. if (!*str)
  173. return str;
  174. temp = str;
  175. /* remove preceding spaces/tabs */
  176. while (is_padding(*temp))
  177. ++temp;
  178. len = strlen(temp);
  179. if (temp != str)
  180. memmove(str, temp, len + 1);
  181. if (len) {
  182. temp = str + (len - 1);
  183. while (is_padding(*temp))
  184. *(temp--) = 0;
  185. }
  186. return str;
  187. }
  188. wchar_t *wcsdepad(wchar_t *str)
  189. {
  190. wchar_t *temp;
  191. size_t len;
  192. if (!str)
  193. return str;
  194. if (!*str)
  195. return str;
  196. temp = str;
  197. /* remove preceding spaces/tabs */
  198. while (is_padding(*temp))
  199. ++temp;
  200. len = wcslen(temp);
  201. if (temp != str)
  202. memmove(str, temp, (len + 1) * sizeof(wchar_t));
  203. if (len) {
  204. temp = str + (len - 1);
  205. while (is_padding(*temp))
  206. *(temp--) = 0;
  207. }
  208. return str;
  209. }
  210. char **strlist_split(const char *str, char split_ch, bool include_empty)
  211. {
  212. const char *cur_str = str;
  213. const char *next_str;
  214. char *out = NULL;
  215. size_t count = 0;
  216. size_t total_size = 0;
  217. if (str) {
  218. char **table;
  219. char *offset;
  220. size_t cur_idx = 0;
  221. size_t cur_pos = 0;
  222. next_str = strchr(str, split_ch);
  223. while (next_str) {
  224. size_t size = next_str - cur_str;
  225. if (size || include_empty) {
  226. ++count;
  227. total_size += size + 1;
  228. }
  229. cur_str = next_str + 1;
  230. next_str = strchr(cur_str, split_ch);
  231. }
  232. if (*cur_str || include_empty) {
  233. ++count;
  234. total_size += strlen(cur_str) + 1;
  235. }
  236. /* ------------------ */
  237. cur_pos = (count + 1) * sizeof(char *);
  238. total_size += cur_pos;
  239. out = bmalloc(total_size);
  240. offset = out + cur_pos;
  241. table = (char **)out;
  242. /* ------------------ */
  243. next_str = strchr(str, split_ch);
  244. cur_str = str;
  245. while (next_str) {
  246. size_t size = next_str - cur_str;
  247. if (size || include_empty) {
  248. table[cur_idx++] = offset;
  249. strncpy(offset, cur_str, size);
  250. offset[size] = 0;
  251. offset += size + 1;
  252. }
  253. cur_str = next_str + 1;
  254. next_str = strchr(cur_str, split_ch);
  255. }
  256. if (*cur_str || include_empty) {
  257. table[cur_idx++] = offset;
  258. strcpy(offset, cur_str);
  259. }
  260. table[cur_idx] = NULL;
  261. }
  262. return (char **)out;
  263. }
  264. void strlist_free(char **strlist)
  265. {
  266. bfree(strlist);
  267. }
  268. void dstr_init_copy_strref(struct dstr *dst, const struct strref *src)
  269. {
  270. dstr_init(dst);
  271. dstr_copy_strref(dst, src);
  272. }
  273. void dstr_copy(struct dstr *dst, const char *array)
  274. {
  275. size_t len;
  276. if (!array || !*array) {
  277. dstr_free(dst);
  278. return;
  279. }
  280. len = strlen(array);
  281. dstr_ensure_capacity(dst, len + 1);
  282. memcpy(dst->array, array, len + 1);
  283. dst->len = len;
  284. }
  285. void dstr_copy_strref(struct dstr *dst, const struct strref *src)
  286. {
  287. if (dst->array)
  288. dstr_free(dst);
  289. dstr_ncopy(dst, src->array, src->len);
  290. }
  291. static inline size_t size_min(size_t a, size_t b)
  292. {
  293. return (a < b) ? a : b;
  294. }
  295. void dstr_ncopy(struct dstr *dst, const char *array, const size_t len)
  296. {
  297. if (dst->array)
  298. dstr_free(dst);
  299. if (!len)
  300. return;
  301. dst->array = bmemdup(array, len + 1);
  302. dst->len = len;
  303. dst->capacity = len + 1;
  304. dst->array[len] = 0;
  305. }
  306. void dstr_ncopy_dstr(struct dstr *dst, const struct dstr *str, const size_t len)
  307. {
  308. size_t newlen;
  309. if (dst->array)
  310. dstr_free(dst);
  311. if (!len)
  312. return;
  313. newlen = size_min(len, str->len);
  314. dst->array = bmemdup(str->array, newlen + 1);
  315. dst->len = newlen;
  316. dst->capacity = newlen + 1;
  317. dst->array[newlen] = 0;
  318. }
  319. void dstr_cat_dstr(struct dstr *dst, const struct dstr *str)
  320. {
  321. size_t new_len;
  322. if (!str->len)
  323. return;
  324. new_len = dst->len + str->len;
  325. dstr_ensure_capacity(dst, new_len + 1);
  326. memcpy(dst->array + dst->len, str->array, str->len + 1);
  327. dst->len = new_len;
  328. }
  329. void dstr_cat_strref(struct dstr *dst, const struct strref *str)
  330. {
  331. dstr_ncat(dst, str->array, str->len);
  332. }
  333. void dstr_ncat(struct dstr *dst, const char *array, const size_t len)
  334. {
  335. size_t new_len;
  336. if (!array || !*array || !len)
  337. return;
  338. new_len = dst->len + len;
  339. dstr_ensure_capacity(dst, new_len + 1);
  340. memcpy(dst->array + dst->len, array, len);
  341. dst->len = new_len;
  342. dst->array[new_len] = 0;
  343. }
  344. void dstr_ncat_dstr(struct dstr *dst, const struct dstr *str, const size_t len)
  345. {
  346. size_t new_len, in_len;
  347. if (!str->array || !*str->array || !len)
  348. return;
  349. in_len = size_min(len, str->len);
  350. new_len = dst->len + in_len;
  351. dstr_ensure_capacity(dst, new_len + 1);
  352. memcpy(dst->array + dst->len, str->array, in_len);
  353. dst->len = new_len;
  354. dst->array[new_len] = 0;
  355. }
  356. void dstr_insert(struct dstr *dst, const size_t idx, const char *array)
  357. {
  358. size_t new_len, len;
  359. if (!array || !*array)
  360. return;
  361. if (idx == dst->len) {
  362. dstr_cat(dst, array);
  363. return;
  364. }
  365. len = strlen(array);
  366. new_len = dst->len + len;
  367. dstr_ensure_capacity(dst, new_len + 1);
  368. memmove(dst->array + idx + len, dst->array + idx, dst->len - idx + 1);
  369. memcpy(dst->array + idx, array, len);
  370. dst->len = new_len;
  371. }
  372. void dstr_insert_dstr(struct dstr *dst, const size_t idx,
  373. const struct dstr *str)
  374. {
  375. size_t new_len;
  376. if (!str->len)
  377. return;
  378. if (idx == dst->len) {
  379. dstr_cat_dstr(dst, str);
  380. return;
  381. }
  382. new_len = dst->len + str->len;
  383. dstr_ensure_capacity(dst, (new_len + 1));
  384. memmove(dst->array + idx + str->len, dst->array + idx,
  385. dst->len - idx + 1);
  386. memcpy(dst->array + idx, str->array, str->len);
  387. dst->len = new_len;
  388. }
  389. void dstr_insert_ch(struct dstr *dst, const size_t idx, const char ch)
  390. {
  391. if (idx == dst->len) {
  392. dstr_cat_ch(dst, ch);
  393. return;
  394. }
  395. dstr_ensure_capacity(dst, (++dst->len + 1));
  396. memmove(dst->array + idx + 1, dst->array + idx, dst->len - idx + 1);
  397. dst->array[idx] = ch;
  398. }
  399. void dstr_remove(struct dstr *dst, const size_t idx, const size_t count)
  400. {
  401. size_t end;
  402. if (!count)
  403. return;
  404. if (count == dst->len) {
  405. dstr_free(dst);
  406. return;
  407. }
  408. end = idx + count;
  409. if (end == dst->len)
  410. dst->array[idx] = 0;
  411. else
  412. memmove(dst->array + idx, dst->array + end, dst->len - end + 1);
  413. dst->len -= count;
  414. }
  415. void dstr_printf(struct dstr *dst, const char *format, ...)
  416. {
  417. va_list args;
  418. va_start(args, format);
  419. dstr_vprintf(dst, format, args);
  420. va_end(args);
  421. }
  422. void dstr_catf(struct dstr *dst, const char *format, ...)
  423. {
  424. va_list args;
  425. va_start(args, format);
  426. dstr_vcatf(dst, format, args);
  427. va_end(args);
  428. }
  429. void dstr_vprintf(struct dstr *dst, const char *format, va_list args)
  430. {
  431. va_list args_cp;
  432. va_copy(args_cp, args);
  433. int len = vsnprintf(NULL, 0, format, args_cp);
  434. va_end(args_cp);
  435. if (len < 0)
  436. len = 4095;
  437. dstr_ensure_capacity(dst, ((size_t)len) + 1);
  438. len = vsnprintf(dst->array, ((size_t)len) + 1, format, args);
  439. if (!*dst->array) {
  440. dstr_free(dst);
  441. return;
  442. }
  443. dst->len = len < 0 ? strlen(dst->array) : (size_t)len;
  444. }
  445. void dstr_vcatf(struct dstr *dst, const char *format, va_list args)
  446. {
  447. va_list args_cp;
  448. va_copy(args_cp, args);
  449. int len = vsnprintf(NULL, 0, format, args_cp);
  450. va_end(args_cp);
  451. if (len < 0)
  452. len = 4095;
  453. dstr_ensure_capacity(dst, dst->len + ((size_t)len) + 1);
  454. len = vsnprintf(dst->array + dst->len, ((size_t)len) + 1, format, args);
  455. if (!*dst->array) {
  456. dstr_free(dst);
  457. return;
  458. }
  459. dst->len += len < 0 ? strlen(dst->array + dst->len) : (size_t)len;
  460. }
  461. void dstr_safe_printf(struct dstr *dst, const char *format, const char *val1,
  462. const char *val2, const char *val3, const char *val4)
  463. {
  464. dstr_copy(dst, format);
  465. if (val1)
  466. dstr_replace(dst, "$1", val1);
  467. if (val2)
  468. dstr_replace(dst, "$2", val2);
  469. if (val3)
  470. dstr_replace(dst, "$3", val3);
  471. if (val4)
  472. dstr_replace(dst, "$4", val4);
  473. }
  474. void dstr_replace(struct dstr *str, const char *find, const char *replace)
  475. {
  476. size_t find_len, replace_len;
  477. char *temp;
  478. if (dstr_is_empty(str))
  479. return;
  480. if (!replace)
  481. replace = "";
  482. find_len = strlen(find);
  483. replace_len = strlen(replace);
  484. temp = str->array;
  485. if (replace_len < find_len) {
  486. unsigned long count = 0;
  487. while ((temp = strstr(temp, find)) != NULL) {
  488. char *end = temp + find_len;
  489. size_t end_len = strlen(end);
  490. if (end_len) {
  491. memmove(temp + replace_len, end, end_len + 1);
  492. if (replace_len)
  493. memcpy(temp, replace, replace_len);
  494. } else {
  495. strcpy(temp, replace);
  496. }
  497. temp += replace_len;
  498. ++count;
  499. }
  500. if (count)
  501. str->len += (replace_len - find_len) * count;
  502. } else if (replace_len > find_len) {
  503. unsigned long count = 0;
  504. while ((temp = strstr(temp, find)) != NULL) {
  505. temp += find_len;
  506. ++count;
  507. }
  508. if (!count)
  509. return;
  510. str->len += (replace_len - find_len) * count;
  511. dstr_ensure_capacity(str, str->len + 1);
  512. temp = str->array;
  513. while ((temp = strstr(temp, find)) != NULL) {
  514. char *end = temp + find_len;
  515. size_t end_len = strlen(end);
  516. if (end_len) {
  517. memmove(temp + replace_len, end, end_len + 1);
  518. memcpy(temp, replace, replace_len);
  519. } else {
  520. strcpy(temp, replace);
  521. }
  522. temp += replace_len;
  523. }
  524. } else {
  525. while ((temp = strstr(temp, find)) != NULL) {
  526. memcpy(temp, replace, replace_len);
  527. temp += replace_len;
  528. }
  529. }
  530. }
  531. void dstr_depad(struct dstr *str)
  532. {
  533. if (str->array) {
  534. str->array = strdepad(str->array);
  535. if (*str->array)
  536. str->len = strlen(str->array);
  537. else
  538. dstr_free(str);
  539. }
  540. }
  541. void dstr_left(struct dstr *dst, const struct dstr *str, const size_t pos)
  542. {
  543. dstr_resize(dst, pos);
  544. if (dst != str)
  545. memcpy(dst->array, str->array, pos);
  546. }
  547. void dstr_mid(struct dstr *dst, const struct dstr *str, const size_t start,
  548. const size_t count)
  549. {
  550. struct dstr temp;
  551. dstr_init(&temp);
  552. dstr_copy_dstr(&temp, str);
  553. dstr_ncopy(dst, temp.array + start, count);
  554. dstr_free(&temp);
  555. }
  556. void dstr_right(struct dstr *dst, const struct dstr *str, const size_t pos)
  557. {
  558. struct dstr temp;
  559. dstr_init(&temp);
  560. dstr_ncopy(&temp, str->array + pos, str->len - pos);
  561. dstr_copy_dstr(dst, &temp);
  562. dstr_free(&temp);
  563. }
  564. void dstr_from_mbs(struct dstr *dst, const char *mbstr)
  565. {
  566. dstr_free(dst);
  567. dst->len = os_mbs_to_utf8_ptr(mbstr, 0, &dst->array);
  568. }
  569. char *dstr_to_mbs(const struct dstr *str)
  570. {
  571. char *dst;
  572. os_mbs_to_utf8_ptr(str->array, str->len, &dst);
  573. return dst;
  574. }
  575. wchar_t *dstr_to_wcs(const struct dstr *str)
  576. {
  577. wchar_t *dst;
  578. os_utf8_to_wcs_ptr(str->array, str->len, &dst);
  579. return dst;
  580. }
  581. void dstr_from_wcs(struct dstr *dst, const wchar_t *wstr)
  582. {
  583. size_t len = wchar_to_utf8(wstr, 0, NULL, 0, 0);
  584. if (len) {
  585. dstr_resize(dst, len);
  586. wchar_to_utf8(wstr, 0, dst->array, len + 1, 0);
  587. } else {
  588. dstr_free(dst);
  589. }
  590. }
  591. void dstr_to_upper(struct dstr *str)
  592. {
  593. wchar_t *wstr;
  594. wchar_t *temp;
  595. if (dstr_is_empty(str))
  596. return;
  597. wstr = dstr_to_wcs(str);
  598. temp = wstr;
  599. if (!wstr)
  600. return;
  601. while (*temp) {
  602. *temp = (wchar_t)towupper(*temp);
  603. temp++;
  604. }
  605. dstr_from_wcs(str, wstr);
  606. bfree(wstr);
  607. }
  608. void dstr_to_lower(struct dstr *str)
  609. {
  610. wchar_t *wstr;
  611. wchar_t *temp;
  612. if (dstr_is_empty(str))
  613. return;
  614. wstr = dstr_to_wcs(str);
  615. temp = wstr;
  616. if (!wstr)
  617. return;
  618. while (*temp) {
  619. *temp = (wchar_t)towlower(*temp);
  620. temp++;
  621. }
  622. dstr_from_wcs(str, wstr);
  623. bfree(wstr);
  624. }