dstr.c 11 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578579580581582583584585586587588589590591
  1. /*
  2. * Copyright (c) 2013 Hugh Bailey <[email protected]>
  3. *
  4. * Permission to use, copy, modify, and distribute this software for any
  5. * purpose with or without fee is hereby granted, provided that the above
  6. * copyright notice and this permission notice appear in all copies.
  7. *
  8. * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
  9. * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
  10. * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
  11. * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
  12. * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
  13. * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
  14. * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
  15. */
  16. #include <stddef.h>
  17. #include <stdlib.h>
  18. #include <stdio.h>
  19. #include <string.h>
  20. #include <assert.h>
  21. #include <ctype.h>
  22. #include <wchar.h>
  23. #include <wctype.h>
  24. #include "c99defs.h"
  25. #include "dstr.h"
  26. #include "bmem.h"
  27. #include "utf8.h"
  28. #include "lexer.h"
  29. #include "platform.h"
  30. static const char *astrblank = "";
  31. static const wchar_t *wstrblank = L"";
  32. int astrcmpi(const char *str1, const char *str2)
  33. {
  34. if (!str1)
  35. str1 = astrblank;
  36. if (!str2)
  37. str2 = astrblank;
  38. do {
  39. char ch1 = (char)toupper(*str1);
  40. char ch2 = (char)toupper(*str2);
  41. if (ch1 < ch2)
  42. return -1;
  43. else if (ch1 > ch2)
  44. return 1;
  45. } while (*str1++ && *str2++);
  46. return 0;
  47. }
  48. int wstrcmpi(const wchar_t *str1, const wchar_t *str2)
  49. {
  50. if (!str1)
  51. str1 = wstrblank;
  52. if (!str2)
  53. str2 = wstrblank;
  54. do {
  55. wchar_t ch1 = (wchar_t)towupper(*str1);
  56. wchar_t ch2 = (wchar_t)towupper(*str2);
  57. if (ch1 < ch2)
  58. return -1;
  59. else if (ch1 > ch2)
  60. return 1;
  61. } while (*str1++ && *str2++);
  62. return 0;
  63. }
  64. int astrcmp_n(const char *str1, const char *str2, size_t n)
  65. {
  66. if (!n)
  67. return 0;
  68. if (!str1)
  69. str1 = astrblank;
  70. if (!str2)
  71. str2 = astrblank;
  72. do {
  73. char ch1 = *str1;
  74. char ch2 = *str2;
  75. if (ch1 < ch2)
  76. return -1;
  77. else if (ch1 > ch2)
  78. return 1;
  79. } while (*str1++ && *str2++ && --n);
  80. return 0;
  81. }
  82. int wstrcmp_n(const wchar_t *str1, const wchar_t *str2, size_t n)
  83. {
  84. if (!n)
  85. return 0;
  86. if (!str1)
  87. str1 = wstrblank;
  88. if (!str2)
  89. str2 = wstrblank;
  90. do {
  91. wchar_t ch1 = *str1;
  92. wchar_t ch2 = *str2;
  93. if (ch1 < ch2)
  94. return -1;
  95. else if (ch1 > ch2)
  96. return 1;
  97. } while (*str1++ && *str2++ && --n);
  98. return 0;
  99. }
  100. int astrcmpi_n(const char *str1, const char *str2, size_t n)
  101. {
  102. if (!n)
  103. return 0;
  104. if (!str1)
  105. str1 = astrblank;
  106. if (!str2)
  107. str2 = astrblank;
  108. do {
  109. char ch1 = (char)toupper(*str1);
  110. char ch2 = (char)toupper(*str2);
  111. if (ch1 < ch2)
  112. return -1;
  113. else if (ch1 > ch2)
  114. return 1;
  115. } while (*str1++ && *str2++ && --n);
  116. return 0;
  117. }
  118. int wstrcmpi_n(const wchar_t *str1, const wchar_t *str2, size_t n)
  119. {
  120. if (!n)
  121. return 0;
  122. if (!str1)
  123. str1 = wstrblank;
  124. if (!str2)
  125. str2 = wstrblank;
  126. do {
  127. wchar_t ch1 = (wchar_t)towupper(*str1);
  128. wchar_t ch2 = (wchar_t)towupper(*str2);
  129. if (ch1 < ch2)
  130. return -1;
  131. else if (ch1 > ch2)
  132. return 1;
  133. } while (*str1++ && *str2++ && --n);
  134. return 0;
  135. }
  136. char *strdepad(char *str)
  137. {
  138. char *temp;
  139. size_t len;
  140. if (!str)
  141. return str;
  142. if (!*str)
  143. return str;
  144. temp = str;
  145. /* remove preceding spaces/tabs */
  146. while (*temp == ' ' || *temp == '\t')
  147. ++temp;
  148. len = strlen(str);
  149. if (temp != str)
  150. memmove(str, temp, len + 1);
  151. if (len) {
  152. temp = str + (len-1);
  153. while (*temp == ' ' || *temp == '\t')
  154. *(temp--) = 0;
  155. }
  156. return str;
  157. }
  158. wchar_t *wcsdepad(wchar_t *str)
  159. {
  160. wchar_t *temp;
  161. size_t len;
  162. if (!str)
  163. return str;
  164. if (!*str)
  165. return str;
  166. temp = str;
  167. /* remove preceding spaces/tabs */
  168. while (*temp == ' ' || *temp == '\t')
  169. ++temp;
  170. len = wcslen(str);
  171. if (temp != str)
  172. memmove(str, temp, (len+1) * sizeof(wchar_t));
  173. if (len) {
  174. temp = str + (len-1);
  175. while (*temp == ' ' || *temp == '\t')
  176. *(temp--) = 0;
  177. }
  178. return str;
  179. }
  180. void dstr_init_strref(struct dstr *dst, const struct strref *src)
  181. {
  182. dstr_init(dst);
  183. dstr_copy_strref(dst, src);
  184. }
  185. void dstr_copy(struct dstr *dst, const char *array)
  186. {
  187. size_t len;
  188. if (!array || !*array) {
  189. dstr_free(dst);
  190. return;
  191. }
  192. len = strlen(array);
  193. dstr_ensure_capacity(dst, len + 1);
  194. memcpy(dst->array, array, len + 1);
  195. dst->len = len;
  196. }
  197. void dstr_copy_strref(struct dstr *dst, const struct strref *src)
  198. {
  199. if (dst->array)
  200. dstr_free(dst);
  201. dstr_ncopy(dst, src->array, src->len);
  202. }
  203. static inline size_t size_min(size_t a, size_t b)
  204. {
  205. return (a < b) ? a : b;
  206. }
  207. void dstr_ncopy(struct dstr *dst, const char *array, const size_t len)
  208. {
  209. if (dst->array)
  210. dstr_free(dst);
  211. if (!len)
  212. return;
  213. dst->array = bmemdup(array, len + 1);
  214. dst->len = len;
  215. dst->array[len] = 0;
  216. }
  217. void dstr_ncopy_dstr(struct dstr *dst, const struct dstr *str, const size_t len)
  218. {
  219. size_t newlen;
  220. if (dst->array)
  221. dstr_free(dst);
  222. if (!len)
  223. return;
  224. newlen = size_min(len, str->len);
  225. dst->array = bmemdup(str->array, newlen + 1);
  226. dst->len = newlen;
  227. dst->array[newlen] = 0;
  228. }
  229. void dstr_cat_dstr(struct dstr *dst, const struct dstr *str)
  230. {
  231. size_t new_len;
  232. if (!str->len)
  233. return;
  234. new_len = dst->len + str->len;
  235. dstr_ensure_capacity(dst, new_len + 1);
  236. memcpy(dst->array+dst->len, str->array, str->len + 1);
  237. dst->len = new_len;
  238. }
  239. void dstr_cat_strref(struct dstr *dst, const struct strref *str)
  240. {
  241. dstr_ncat(dst, str->array, str->len);
  242. }
  243. void dstr_ncat(struct dstr *dst, const char *array, const size_t len)
  244. {
  245. size_t new_len;
  246. if (!array || !*array || !len)
  247. return;
  248. new_len = dst->len + len;
  249. dstr_ensure_capacity(dst, new_len + 1);
  250. memcpy(dst->array+dst->len, array, len);
  251. dst->len = new_len;
  252. dst->array[new_len] = 0;
  253. }
  254. void dstr_ncat_dstr(struct dstr *dst, const struct dstr *str, const size_t len)
  255. {
  256. size_t new_len, in_len;
  257. if (!str->array || !*str->array || !len)
  258. return;
  259. in_len = size_min(len, str->len);
  260. new_len = dst->len + in_len;
  261. dstr_ensure_capacity(dst, new_len + 1);
  262. memcpy(dst->array+dst->len, str->array, in_len);
  263. dst->len = new_len;
  264. dst->array[new_len] = 0;
  265. }
  266. void dstr_insert(struct dstr *dst, const size_t idx, const char *array)
  267. {
  268. size_t new_len, len;
  269. if (!array || !*array)
  270. return;
  271. if (idx == dst->len) {
  272. dstr_cat(dst, array);
  273. return;
  274. }
  275. len = strlen(array);
  276. new_len = dst->len + len;
  277. dstr_ensure_capacity(dst, new_len + 1);
  278. dst->len = new_len;
  279. memmove(dst->array+idx+len, dst->array+idx, dst->len - idx + 1);
  280. memcpy(dst->array+idx, array, len);
  281. }
  282. void dstr_insert_dstr(struct dstr *dst, const size_t idx,
  283. const struct dstr *str)
  284. {
  285. size_t new_len;
  286. if (!str->len)
  287. return;
  288. if (idx == dst->len) {
  289. dstr_cat_dstr(dst, str);
  290. return;
  291. }
  292. new_len = dst->len + str->len;
  293. dstr_ensure_capacity(dst, (new_len+1));
  294. dst->len = new_len;
  295. memmove(dst->array+idx+str->len, dst->array+idx, dst->len - idx + 1);
  296. memcpy(dst->array+idx, str->array, str->len);
  297. }
  298. void dstr_insert_ch(struct dstr *dst, const size_t idx, const char ch)
  299. {
  300. if (idx == dst->len) {
  301. dstr_cat_ch(dst, ch);
  302. return;
  303. }
  304. dstr_ensure_capacity(dst, (++dst->len+1));
  305. memmove(dst->array+idx+1, dst->array+idx, dst->len - idx + 1);
  306. dst->array[idx] = ch;
  307. }
  308. void dstr_remove(struct dstr *dst, const size_t idx, const size_t count)
  309. {
  310. size_t end;
  311. if (!count)
  312. return;
  313. if (count == dst->len) {
  314. dstr_free(dst);
  315. return;
  316. }
  317. end = idx+count;
  318. if (end == dst->len)
  319. dst->array[idx] = 0;
  320. else
  321. memmove(dst->array+idx, dst->array+end, dst->len - end + 1);
  322. dst->len -= count;
  323. }
  324. void dstr_printf(struct dstr *dst, const char *format, ...)
  325. {
  326. va_list args;
  327. va_start(args, format);
  328. dstr_vprintf(dst, format, args);
  329. va_end(args);
  330. }
  331. void dstr_catf(struct dstr *dst, const char *format, ...)
  332. {
  333. va_list args;
  334. va_start(args, format);
  335. dstr_vcatf(dst, format, args);
  336. va_end(args);
  337. }
  338. void dstr_vprintf(struct dstr *dst, const char *format, va_list args)
  339. {
  340. dstr_ensure_capacity(dst, 4096);
  341. vsnprintf(dst->array, 4095, format, args);
  342. if (!*dst->array) {
  343. dstr_free(dst);
  344. return;
  345. }
  346. dst->len = strlen(dst->array);
  347. }
  348. void dstr_vcatf(struct dstr *dst, const char *format, va_list args)
  349. {
  350. struct dstr temp;
  351. dstr_init(&temp);
  352. dstr_vprintf(&temp, format, args);
  353. dstr_cat_dstr(dst, &temp);
  354. dstr_free(&temp);
  355. }
  356. void dstr_safe_printf(struct dstr *dst, const char *format,
  357. const char *val1, const char *val2, const char *val3,
  358. const char *val4)
  359. {
  360. dstr_copy(dst, format);
  361. if (val1)
  362. dstr_replace(dst, "$1", val1);
  363. if (val2)
  364. dstr_replace(dst, "$2", val2);
  365. if (val3)
  366. dstr_replace(dst, "$3", val3);
  367. if (val4)
  368. dstr_replace(dst, "$4", val4);
  369. }
  370. void dstr_replace(struct dstr *str, const char *find,
  371. const char *replace)
  372. {
  373. size_t find_len, replace_len;
  374. char *temp;
  375. if (!replace)
  376. replace = "";
  377. find_len = strlen(find);
  378. replace_len = strlen(replace);
  379. temp = str->array;
  380. if (replace_len < find_len) {
  381. unsigned long count = 0;
  382. while ((temp = strstr(temp, find)) != NULL) {
  383. char *end = temp+find_len;
  384. size_t end_len = strlen(end);
  385. if (end_len) {
  386. memmove(temp+replace_len, end, end_len + 1);
  387. if (replace_len)
  388. memcpy(temp, replace, replace_len);
  389. } else {
  390. strcpy(temp, replace);
  391. }
  392. temp += replace_len;
  393. ++count;
  394. }
  395. if (count)
  396. str->len += (replace_len-find_len) * count;
  397. } else if (replace_len > find_len) {
  398. unsigned long count = 0;
  399. while ((temp = strstr(temp, find)) != NULL) {
  400. temp += find_len;
  401. ++count;
  402. }
  403. if (!count)
  404. return;
  405. str->len += (replace_len-find_len) * count;
  406. dstr_ensure_capacity(str, str->len + 1);
  407. temp = str->array;
  408. while ((temp = strstr(temp, find)) != NULL) {
  409. char *end = temp+find_len;
  410. size_t end_len = strlen(end);
  411. if (end_len) {
  412. memmove(temp+replace_len, end, end_len + 1);
  413. memcpy(temp, replace, replace_len);
  414. } else {
  415. strcpy(temp, replace);
  416. }
  417. temp += replace_len;
  418. }
  419. } else {
  420. while ((temp = strstr(temp, find)) != NULL) {
  421. memcpy(temp, replace, replace_len);
  422. temp += replace_len;
  423. }
  424. }
  425. }
  426. void dstr_depad(struct dstr *str)
  427. {
  428. if (str->array) {
  429. str->array = strdepad(str->array);
  430. if (*str->array)
  431. str->len = strlen(str->array);
  432. else
  433. dstr_free(str);
  434. }
  435. }
  436. void dstr_left(struct dstr *dst, const struct dstr *str, const size_t pos)
  437. {
  438. dstr_resize(dst, pos);
  439. if (dst != str)
  440. memcpy(dst->array, str->array, pos);
  441. }
  442. void dstr_mid(struct dstr *dst, const struct dstr *str, const size_t start,
  443. const size_t count)
  444. {
  445. struct dstr temp;
  446. dstr_init(&temp);
  447. dstr_copy_dstr(&temp, str);
  448. dstr_ncopy(dst, temp.array+start, count);
  449. dstr_free(&temp);
  450. }
  451. void dstr_right(struct dstr *dst, const struct dstr *str, const size_t pos)
  452. {
  453. struct dstr temp;
  454. dstr_init(&temp);
  455. dstr_ncopy(&temp, str->array+pos, str->len-pos);
  456. dstr_copy_dstr(dst, &temp);
  457. dstr_free(&temp);
  458. }
  459. void dstr_from_mbs(struct dstr *dst, const char *mbstr)
  460. {
  461. dstr_free(dst);
  462. dst->len = os_mbs_to_utf8(mbstr, 0, &dst->array);
  463. }
  464. char *dstr_to_mbs(const struct dstr *str)
  465. {
  466. char *dst;
  467. os_mbs_to_utf8(str->array, str->len, &dst);
  468. return dst;
  469. }
  470. void dstr_from_wcs(struct dstr *dst, const wchar_t *wstr)
  471. {
  472. size_t len = wchar_to_utf8(wstr, 0, NULL, 0, 0);
  473. if (len) {
  474. dstr_resize(dst, len);
  475. wchar_to_utf8(wstr, 0, dst->array, len+1, 0);
  476. } else {
  477. dstr_free(dst);
  478. }
  479. }