dstr.c 12 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578579580581582583584585586587588589590591592593594595596597598599600601602603604605606607608609610611612613614615616617618619620621622623624625626627628629630631632633634635636637638639640641642643644645646647648649650651652653654655656657658659660661662663664665666667668669670671672673674675676677678679680681682683684
  1. /*
  2. * Copyright (c) 2013 Hugh Bailey <[email protected]>
  3. *
  4. * Permission to use, copy, modify, and distribute this software for any
  5. * purpose with or without fee is hereby granted, provided that the above
  6. * copyright notice and this permission notice appear in all copies.
  7. *
  8. * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
  9. * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
  10. * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
  11. * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
  12. * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
  13. * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
  14. * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
  15. */
  16. #include <stddef.h>
  17. #include <stdlib.h>
  18. #include <stdio.h>
  19. #include <string.h>
  20. #include <assert.h>
  21. #include <ctype.h>
  22. #include <wchar.h>
  23. #include <wctype.h>
  24. #include "c99defs.h"
  25. #include "dstr.h"
  26. #include "darray.h"
  27. #include "bmem.h"
  28. #include "utf8.h"
  29. #include "lexer.h"
  30. #include "platform.h"
  31. static const char *astrblank = "";
  32. static const wchar_t *wstrblank = L"";
  33. int astrcmpi(const char *str1, const char *str2)
  34. {
  35. if (!str1)
  36. str1 = astrblank;
  37. if (!str2)
  38. str2 = astrblank;
  39. do {
  40. char ch1 = (char)toupper(*str1);
  41. char ch2 = (char)toupper(*str2);
  42. if (ch1 < ch2)
  43. return -1;
  44. else if (ch1 > ch2)
  45. return 1;
  46. } while (*str1++ && *str2++);
  47. return 0;
  48. }
  49. int wstrcmpi(const wchar_t *str1, const wchar_t *str2)
  50. {
  51. if (!str1)
  52. str1 = wstrblank;
  53. if (!str2)
  54. str2 = wstrblank;
  55. do {
  56. wchar_t ch1 = (wchar_t)towupper(*str1);
  57. wchar_t ch2 = (wchar_t)towupper(*str2);
  58. if (ch1 < ch2)
  59. return -1;
  60. else if (ch1 > ch2)
  61. return 1;
  62. } while (*str1++ && *str2++);
  63. return 0;
  64. }
  65. int astrcmp_n(const char *str1, const char *str2, size_t n)
  66. {
  67. if (!n)
  68. return 0;
  69. if (!str1)
  70. str1 = astrblank;
  71. if (!str2)
  72. str2 = astrblank;
  73. do {
  74. char ch1 = *str1;
  75. char ch2 = *str2;
  76. if (ch1 < ch2)
  77. return -1;
  78. else if (ch1 > ch2)
  79. return 1;
  80. } while (*str1++ && *str2++ && --n);
  81. return 0;
  82. }
  83. int wstrcmp_n(const wchar_t *str1, const wchar_t *str2, size_t n)
  84. {
  85. if (!n)
  86. return 0;
  87. if (!str1)
  88. str1 = wstrblank;
  89. if (!str2)
  90. str2 = wstrblank;
  91. do {
  92. wchar_t ch1 = *str1;
  93. wchar_t ch2 = *str2;
  94. if (ch1 < ch2)
  95. return -1;
  96. else if (ch1 > ch2)
  97. return 1;
  98. } while (*str1++ && *str2++ && --n);
  99. return 0;
  100. }
  101. int astrcmpi_n(const char *str1, const char *str2, size_t n)
  102. {
  103. if (!n)
  104. return 0;
  105. if (!str1)
  106. str1 = astrblank;
  107. if (!str2)
  108. str2 = astrblank;
  109. do {
  110. char ch1 = (char)toupper(*str1);
  111. char ch2 = (char)toupper(*str2);
  112. if (ch1 < ch2)
  113. return -1;
  114. else if (ch1 > ch2)
  115. return 1;
  116. } while (*str1++ && *str2++ && --n);
  117. return 0;
  118. }
  119. int wstrcmpi_n(const wchar_t *str1, const wchar_t *str2, size_t n)
  120. {
  121. if (!n)
  122. return 0;
  123. if (!str1)
  124. str1 = wstrblank;
  125. if (!str2)
  126. str2 = wstrblank;
  127. do {
  128. wchar_t ch1 = (wchar_t)towupper(*str1);
  129. wchar_t ch2 = (wchar_t)towupper(*str2);
  130. if (ch1 < ch2)
  131. return -1;
  132. else if (ch1 > ch2)
  133. return 1;
  134. } while (*str1++ && *str2++ && --n);
  135. return 0;
  136. }
  137. char *astrstri(const char *str, const char *find)
  138. {
  139. size_t len;
  140. if (!str || !find)
  141. return NULL;
  142. len = strlen(find);
  143. do {
  144. if (astrcmpi_n(str, find, len) == 0)
  145. return (char*)str;
  146. } while (*str++);
  147. return NULL;
  148. }
  149. wchar_t *wstrstri(const wchar_t *str, const wchar_t *find)
  150. {
  151. size_t len;
  152. if (!str || !find)
  153. return NULL;
  154. len = wcslen(find);
  155. do {
  156. if (wstrcmpi_n(str, find, len) == 0)
  157. return (wchar_t*)str;
  158. } while (*str++);
  159. return NULL;
  160. }
  161. char *strdepad(char *str)
  162. {
  163. char *temp;
  164. size_t len;
  165. if (!str)
  166. return str;
  167. if (!*str)
  168. return str;
  169. temp = str;
  170. /* remove preceding spaces/tabs */
  171. while (*temp == ' ' || *temp == '\t')
  172. ++temp;
  173. len = strlen(str);
  174. if (temp != str)
  175. memmove(str, temp, len + 1);
  176. if (len) {
  177. temp = str + (len-1);
  178. while (*temp == ' ' || *temp == '\t')
  179. *(temp--) = 0;
  180. }
  181. return str;
  182. }
  183. wchar_t *wcsdepad(wchar_t *str)
  184. {
  185. wchar_t *temp;
  186. size_t len;
  187. if (!str)
  188. return str;
  189. if (!*str)
  190. return str;
  191. temp = str;
  192. /* remove preceding spaces/tabs */
  193. while (*temp == ' ' || *temp == '\t')
  194. ++temp;
  195. len = wcslen(str);
  196. if (temp != str)
  197. memmove(str, temp, (len+1) * sizeof(wchar_t));
  198. if (len) {
  199. temp = str + (len-1);
  200. while (*temp == ' ' || *temp == '\t')
  201. *(temp--) = 0;
  202. }
  203. return str;
  204. }
  205. char **strlist_split(const char *str, char split_ch, bool include_empty)
  206. {
  207. const char *cur_str = str;
  208. const char *next_str;
  209. const char *new_str;
  210. DARRAY(char*) list;
  211. da_init(list);
  212. if (str) {
  213. next_str = strchr(str, split_ch);
  214. while (next_str) {
  215. size_t size = next_str - cur_str;
  216. if (size || include_empty) {
  217. new_str = bstrdup_n(cur_str, size);
  218. da_push_back(list, &new_str);
  219. }
  220. cur_str = next_str+1;
  221. next_str = strchr(cur_str, split_ch);
  222. }
  223. if (*cur_str || include_empty) {
  224. new_str = bstrdup(cur_str);
  225. da_push_back(list, &new_str);
  226. }
  227. }
  228. new_str = NULL;
  229. da_push_back(list, &new_str);
  230. return list.array;
  231. }
  232. void strlist_free(char **strlist)
  233. {
  234. if (strlist) {
  235. char **temp = strlist;
  236. while (*temp)
  237. bfree(*(temp++));
  238. bfree(strlist);
  239. }
  240. }
  241. void dstr_init_copy_strref(struct dstr *dst, const struct strref *src)
  242. {
  243. dstr_init(dst);
  244. dstr_copy_strref(dst, src);
  245. }
  246. void dstr_copy(struct dstr *dst, const char *array)
  247. {
  248. size_t len;
  249. if (!array || !*array) {
  250. dstr_free(dst);
  251. return;
  252. }
  253. len = strlen(array);
  254. dstr_ensure_capacity(dst, len + 1);
  255. memcpy(dst->array, array, len + 1);
  256. dst->len = len;
  257. }
  258. void dstr_copy_strref(struct dstr *dst, const struct strref *src)
  259. {
  260. if (dst->array)
  261. dstr_free(dst);
  262. dstr_ncopy(dst, src->array, src->len);
  263. }
  264. static inline size_t size_min(size_t a, size_t b)
  265. {
  266. return (a < b) ? a : b;
  267. }
  268. void dstr_ncopy(struct dstr *dst, const char *array, const size_t len)
  269. {
  270. if (dst->array)
  271. dstr_free(dst);
  272. if (!len)
  273. return;
  274. dst->array = bmemdup(array, len + 1);
  275. dst->len = len;
  276. dst->array[len] = 0;
  277. }
  278. void dstr_ncopy_dstr(struct dstr *dst, const struct dstr *str, const size_t len)
  279. {
  280. size_t newlen;
  281. if (dst->array)
  282. dstr_free(dst);
  283. if (!len)
  284. return;
  285. newlen = size_min(len, str->len);
  286. dst->array = bmemdup(str->array, newlen + 1);
  287. dst->len = newlen;
  288. dst->array[newlen] = 0;
  289. }
  290. void dstr_cat_dstr(struct dstr *dst, const struct dstr *str)
  291. {
  292. size_t new_len;
  293. if (!str->len)
  294. return;
  295. new_len = dst->len + str->len;
  296. dstr_ensure_capacity(dst, new_len + 1);
  297. memcpy(dst->array+dst->len, str->array, str->len + 1);
  298. dst->len = new_len;
  299. }
  300. void dstr_cat_strref(struct dstr *dst, const struct strref *str)
  301. {
  302. dstr_ncat(dst, str->array, str->len);
  303. }
  304. void dstr_ncat(struct dstr *dst, const char *array, const size_t len)
  305. {
  306. size_t new_len;
  307. if (!array || !*array || !len)
  308. return;
  309. new_len = dst->len + len;
  310. dstr_ensure_capacity(dst, new_len + 1);
  311. memcpy(dst->array+dst->len, array, len);
  312. dst->len = new_len;
  313. dst->array[new_len] = 0;
  314. }
  315. void dstr_ncat_dstr(struct dstr *dst, const struct dstr *str, const size_t len)
  316. {
  317. size_t new_len, in_len;
  318. if (!str->array || !*str->array || !len)
  319. return;
  320. in_len = size_min(len, str->len);
  321. new_len = dst->len + in_len;
  322. dstr_ensure_capacity(dst, new_len + 1);
  323. memcpy(dst->array+dst->len, str->array, in_len);
  324. dst->len = new_len;
  325. dst->array[new_len] = 0;
  326. }
  327. void dstr_insert(struct dstr *dst, const size_t idx, const char *array)
  328. {
  329. size_t new_len, len;
  330. if (!array || !*array)
  331. return;
  332. if (idx == dst->len) {
  333. dstr_cat(dst, array);
  334. return;
  335. }
  336. len = strlen(array);
  337. new_len = dst->len + len;
  338. dstr_ensure_capacity(dst, new_len + 1);
  339. dst->len = new_len;
  340. memmove(dst->array+idx+len, dst->array+idx, dst->len - idx + 1);
  341. memcpy(dst->array+idx, array, len);
  342. }
  343. void dstr_insert_dstr(struct dstr *dst, const size_t idx,
  344. const struct dstr *str)
  345. {
  346. size_t new_len;
  347. if (!str->len)
  348. return;
  349. if (idx == dst->len) {
  350. dstr_cat_dstr(dst, str);
  351. return;
  352. }
  353. new_len = dst->len + str->len;
  354. dstr_ensure_capacity(dst, (new_len+1));
  355. dst->len = new_len;
  356. memmove(dst->array+idx+str->len, dst->array+idx, dst->len - idx + 1);
  357. memcpy(dst->array+idx, str->array, str->len);
  358. }
  359. void dstr_insert_ch(struct dstr *dst, const size_t idx, const char ch)
  360. {
  361. if (idx == dst->len) {
  362. dstr_cat_ch(dst, ch);
  363. return;
  364. }
  365. dstr_ensure_capacity(dst, (++dst->len+1));
  366. memmove(dst->array+idx+1, dst->array+idx, dst->len - idx + 1);
  367. dst->array[idx] = ch;
  368. }
  369. void dstr_remove(struct dstr *dst, const size_t idx, const size_t count)
  370. {
  371. size_t end;
  372. if (!count)
  373. return;
  374. if (count == dst->len) {
  375. dstr_free(dst);
  376. return;
  377. }
  378. end = idx+count;
  379. if (end == dst->len)
  380. dst->array[idx] = 0;
  381. else
  382. memmove(dst->array+idx, dst->array+end, dst->len - end + 1);
  383. dst->len -= count;
  384. }
  385. void dstr_printf(struct dstr *dst, const char *format, ...)
  386. {
  387. va_list args;
  388. va_start(args, format);
  389. dstr_vprintf(dst, format, args);
  390. va_end(args);
  391. }
  392. void dstr_catf(struct dstr *dst, const char *format, ...)
  393. {
  394. va_list args;
  395. va_start(args, format);
  396. dstr_vcatf(dst, format, args);
  397. va_end(args);
  398. }
  399. void dstr_vprintf(struct dstr *dst, const char *format, va_list args)
  400. {
  401. dstr_ensure_capacity(dst, 4096);
  402. vsnprintf(dst->array, 4095, format, args);
  403. if (!*dst->array) {
  404. dstr_free(dst);
  405. return;
  406. }
  407. dst->len = strlen(dst->array);
  408. }
  409. void dstr_vcatf(struct dstr *dst, const char *format, va_list args)
  410. {
  411. struct dstr temp;
  412. dstr_init(&temp);
  413. dstr_vprintf(&temp, format, args);
  414. dstr_cat_dstr(dst, &temp);
  415. dstr_free(&temp);
  416. }
  417. void dstr_safe_printf(struct dstr *dst, const char *format,
  418. const char *val1, const char *val2, const char *val3,
  419. const char *val4)
  420. {
  421. dstr_copy(dst, format);
  422. if (val1)
  423. dstr_replace(dst, "$1", val1);
  424. if (val2)
  425. dstr_replace(dst, "$2", val2);
  426. if (val3)
  427. dstr_replace(dst, "$3", val3);
  428. if (val4)
  429. dstr_replace(dst, "$4", val4);
  430. }
  431. void dstr_replace(struct dstr *str, const char *find,
  432. const char *replace)
  433. {
  434. size_t find_len, replace_len;
  435. char *temp;
  436. if (dstr_is_empty(str))
  437. return;
  438. if (!replace)
  439. replace = "";
  440. find_len = strlen(find);
  441. replace_len = strlen(replace);
  442. temp = str->array;
  443. if (replace_len < find_len) {
  444. unsigned long count = 0;
  445. while ((temp = strstr(temp, find)) != NULL) {
  446. char *end = temp+find_len;
  447. size_t end_len = strlen(end);
  448. if (end_len) {
  449. memmove(temp+replace_len, end, end_len + 1);
  450. if (replace_len)
  451. memcpy(temp, replace, replace_len);
  452. } else {
  453. strcpy(temp, replace);
  454. }
  455. temp += replace_len;
  456. ++count;
  457. }
  458. if (count)
  459. str->len += (replace_len-find_len) * count;
  460. } else if (replace_len > find_len) {
  461. unsigned long count = 0;
  462. while ((temp = strstr(temp, find)) != NULL) {
  463. temp += find_len;
  464. ++count;
  465. }
  466. if (!count)
  467. return;
  468. str->len += (replace_len-find_len) * count;
  469. dstr_ensure_capacity(str, str->len + 1);
  470. temp = str->array;
  471. while ((temp = strstr(temp, find)) != NULL) {
  472. char *end = temp+find_len;
  473. size_t end_len = strlen(end);
  474. if (end_len) {
  475. memmove(temp+replace_len, end, end_len + 1);
  476. memcpy(temp, replace, replace_len);
  477. } else {
  478. strcpy(temp, replace);
  479. }
  480. temp += replace_len;
  481. }
  482. } else {
  483. while ((temp = strstr(temp, find)) != NULL) {
  484. memcpy(temp, replace, replace_len);
  485. temp += replace_len;
  486. }
  487. }
  488. }
  489. void dstr_depad(struct dstr *str)
  490. {
  491. if (str->array) {
  492. str->array = strdepad(str->array);
  493. if (*str->array)
  494. str->len = strlen(str->array);
  495. else
  496. dstr_free(str);
  497. }
  498. }
  499. void dstr_left(struct dstr *dst, const struct dstr *str, const size_t pos)
  500. {
  501. dstr_resize(dst, pos);
  502. if (dst != str)
  503. memcpy(dst->array, str->array, pos);
  504. }
  505. void dstr_mid(struct dstr *dst, const struct dstr *str, const size_t start,
  506. const size_t count)
  507. {
  508. struct dstr temp;
  509. dstr_init(&temp);
  510. dstr_copy_dstr(&temp, str);
  511. dstr_ncopy(dst, temp.array+start, count);
  512. dstr_free(&temp);
  513. }
  514. void dstr_right(struct dstr *dst, const struct dstr *str, const size_t pos)
  515. {
  516. struct dstr temp;
  517. dstr_init(&temp);
  518. dstr_ncopy(&temp, str->array+pos, str->len-pos);
  519. dstr_copy_dstr(dst, &temp);
  520. dstr_free(&temp);
  521. }
  522. void dstr_from_mbs(struct dstr *dst, const char *mbstr)
  523. {
  524. dstr_free(dst);
  525. dst->len = os_mbs_to_utf8_ptr(mbstr, 0, &dst->array);
  526. }
  527. char *dstr_to_mbs(const struct dstr *str)
  528. {
  529. char *dst;
  530. os_mbs_to_utf8_ptr(str->array, str->len, &dst);
  531. return dst;
  532. }
  533. wchar_t *dstr_to_wcs(const struct dstr *str)
  534. {
  535. wchar_t *dst;
  536. os_utf8_to_wcs_ptr(str->array, str->len, &dst);
  537. return dst;
  538. }
  539. void dstr_from_wcs(struct dstr *dst, const wchar_t *wstr)
  540. {
  541. size_t len = wchar_to_utf8(wstr, 0, NULL, 0, 0);
  542. if (len) {
  543. dstr_resize(dst, len);
  544. wchar_to_utf8(wstr, 0, dst->array, len+1, 0);
  545. } else {
  546. dstr_free(dst);
  547. }
  548. }