dstr.c 11 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578579580581582583584585586587588589590591592593594595596597598599600601602603604605606607608
  1. /*
  2. * Copyright (c) 2013 Hugh Bailey <[email protected]>
  3. *
  4. * Permission to use, copy, modify, and distribute this software for any
  5. * purpose with or without fee is hereby granted, provided that the above
  6. * copyright notice and this permission notice appear in all copies.
  7. *
  8. * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
  9. * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
  10. * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
  11. * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
  12. * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
  13. * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
  14. * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
  15. */
  16. #include <stddef.h>
  17. #include <stdlib.h>
  18. #include <stdio.h>
  19. #include <string.h>
  20. #include <assert.h>
  21. #include <ctype.h>
  22. #include <wchar.h>
  23. #include <wctype.h>
  24. #include "c99defs.h"
  25. #include "dstr.h"
  26. #include "bmem.h"
  27. #include "utf8.h"
  28. #include "lexer.h"
  29. #include "platform.h"
  30. static const char *astrblank = "";
  31. static const wchar_t *wstrblank = L"";
  32. int astrcmpi(const char *str1, const char *str2)
  33. {
  34. if (!str1)
  35. str1 = astrblank;
  36. if (!str2)
  37. str2 = astrblank;
  38. do {
  39. char ch1 = (char)toupper(*str1);
  40. char ch2 = (char)toupper(*str2);
  41. if (ch1 < ch2)
  42. return -1;
  43. else if (ch1 > ch2)
  44. return 1;
  45. } while (*str1++ && *str2++);
  46. return 0;
  47. }
  48. int wstrcmpi(const wchar_t *str1, const wchar_t *str2)
  49. {
  50. if (!str1)
  51. str1 = wstrblank;
  52. if (!str2)
  53. str2 = wstrblank;
  54. do {
  55. wchar_t ch1 = (wchar_t)towupper(*str1);
  56. wchar_t ch2 = (wchar_t)towupper(*str2);
  57. if (ch1 < ch2)
  58. return -1;
  59. else if (ch1 > ch2)
  60. return 1;
  61. } while (*str1++ && *str2++);
  62. return 0;
  63. }
  64. int astrcmp_n(const char *str1, const char *str2, size_t n)
  65. {
  66. if (!n)
  67. return 0;
  68. if (!str1)
  69. str1 = astrblank;
  70. if (!str2)
  71. str2 = astrblank;
  72. do {
  73. char ch1 = *str1;
  74. char ch2 = *str2;
  75. if (ch1 < ch2)
  76. return -1;
  77. else if (ch1 > ch2)
  78. return 1;
  79. } while (*str1++ && *str2++ && --n);
  80. return 0;
  81. }
  82. int wstrcmp_n(const wchar_t *str1, const wchar_t *str2, size_t n)
  83. {
  84. if (!n)
  85. return 0;
  86. if (!str1)
  87. str1 = wstrblank;
  88. if (!str2)
  89. str2 = wstrblank;
  90. do {
  91. wchar_t ch1 = *str1;
  92. wchar_t ch2 = *str2;
  93. if (ch1 < ch2)
  94. return -1;
  95. else if (ch1 > ch2)
  96. return 1;
  97. } while (*str1++ && *str2++ && --n);
  98. return 0;
  99. }
  100. int astrcmpi_n(const char *str1, const char *str2, size_t n)
  101. {
  102. if (!n)
  103. return 0;
  104. if (!str1)
  105. str1 = astrblank;
  106. if (!str2)
  107. str2 = astrblank;
  108. do {
  109. char ch1 = (char)toupper(*str1);
  110. char ch2 = (char)toupper(*str2);
  111. if (ch1 < ch2)
  112. return -1;
  113. else if (ch1 > ch2)
  114. return 1;
  115. } while (*str1++ && *str2++ && --n);
  116. return 0;
  117. }
  118. int wstrcmpi_n(const wchar_t *str1, const wchar_t *str2, size_t n)
  119. {
  120. if (!n)
  121. return 0;
  122. if (!str1)
  123. str1 = wstrblank;
  124. if (!str2)
  125. str2 = wstrblank;
  126. do {
  127. wchar_t ch1 = (wchar_t)towupper(*str1);
  128. wchar_t ch2 = (wchar_t)towupper(*str2);
  129. if (ch1 < ch2)
  130. return -1;
  131. else if (ch1 > ch2)
  132. return 1;
  133. } while (*str1++ && *str2++ && --n);
  134. return 0;
  135. }
  136. char *astrstri(char *str, const char *find)
  137. {
  138. size_t len;
  139. if (!str || !find)
  140. return NULL;
  141. len = strlen(find);
  142. do {
  143. if (astrcmpi_n(str, find, len) == 0)
  144. return str;
  145. } while (*str++);
  146. return NULL;
  147. }
  148. char *strdepad(char *str)
  149. {
  150. char *temp;
  151. size_t len;
  152. if (!str)
  153. return str;
  154. if (!*str)
  155. return str;
  156. temp = str;
  157. /* remove preceding spaces/tabs */
  158. while (*temp == ' ' || *temp == '\t')
  159. ++temp;
  160. len = strlen(str);
  161. if (temp != str)
  162. memmove(str, temp, len + 1);
  163. if (len) {
  164. temp = str + (len-1);
  165. while (*temp == ' ' || *temp == '\t')
  166. *(temp--) = 0;
  167. }
  168. return str;
  169. }
  170. wchar_t *wcsdepad(wchar_t *str)
  171. {
  172. wchar_t *temp;
  173. size_t len;
  174. if (!str)
  175. return str;
  176. if (!*str)
  177. return str;
  178. temp = str;
  179. /* remove preceding spaces/tabs */
  180. while (*temp == ' ' || *temp == '\t')
  181. ++temp;
  182. len = wcslen(str);
  183. if (temp != str)
  184. memmove(str, temp, (len+1) * sizeof(wchar_t));
  185. if (len) {
  186. temp = str + (len-1);
  187. while (*temp == ' ' || *temp == '\t')
  188. *(temp--) = 0;
  189. }
  190. return str;
  191. }
  192. void dstr_init_strref(struct dstr *dst, const struct strref *src)
  193. {
  194. dstr_init(dst);
  195. dstr_copy_strref(dst, src);
  196. }
  197. void dstr_copy(struct dstr *dst, const char *array)
  198. {
  199. size_t len;
  200. if (!array || !*array) {
  201. dstr_free(dst);
  202. return;
  203. }
  204. len = strlen(array);
  205. dstr_ensure_capacity(dst, len + 1);
  206. memcpy(dst->array, array, len + 1);
  207. dst->len = len;
  208. }
  209. void dstr_copy_strref(struct dstr *dst, const struct strref *src)
  210. {
  211. if (dst->array)
  212. dstr_free(dst);
  213. dstr_ncopy(dst, src->array, src->len);
  214. }
  215. static inline size_t size_min(size_t a, size_t b)
  216. {
  217. return (a < b) ? a : b;
  218. }
  219. void dstr_ncopy(struct dstr *dst, const char *array, const size_t len)
  220. {
  221. if (dst->array)
  222. dstr_free(dst);
  223. if (!len)
  224. return;
  225. dst->array = bmemdup(array, len + 1);
  226. dst->len = len;
  227. dst->array[len] = 0;
  228. }
  229. void dstr_ncopy_dstr(struct dstr *dst, const struct dstr *str, const size_t len)
  230. {
  231. size_t newlen;
  232. if (dst->array)
  233. dstr_free(dst);
  234. if (!len)
  235. return;
  236. newlen = size_min(len, str->len);
  237. dst->array = bmemdup(str->array, newlen + 1);
  238. dst->len = newlen;
  239. dst->array[newlen] = 0;
  240. }
  241. void dstr_cat_dstr(struct dstr *dst, const struct dstr *str)
  242. {
  243. size_t new_len;
  244. if (!str->len)
  245. return;
  246. new_len = dst->len + str->len;
  247. dstr_ensure_capacity(dst, new_len + 1);
  248. memcpy(dst->array+dst->len, str->array, str->len + 1);
  249. dst->len = new_len;
  250. }
  251. void dstr_cat_strref(struct dstr *dst, const struct strref *str)
  252. {
  253. dstr_ncat(dst, str->array, str->len);
  254. }
  255. void dstr_ncat(struct dstr *dst, const char *array, const size_t len)
  256. {
  257. size_t new_len;
  258. if (!array || !*array || !len)
  259. return;
  260. new_len = dst->len + len;
  261. dstr_ensure_capacity(dst, new_len + 1);
  262. memcpy(dst->array+dst->len, array, len);
  263. dst->len = new_len;
  264. dst->array[new_len] = 0;
  265. }
  266. void dstr_ncat_dstr(struct dstr *dst, const struct dstr *str, const size_t len)
  267. {
  268. size_t new_len, in_len;
  269. if (!str->array || !*str->array || !len)
  270. return;
  271. in_len = size_min(len, str->len);
  272. new_len = dst->len + in_len;
  273. dstr_ensure_capacity(dst, new_len + 1);
  274. memcpy(dst->array+dst->len, str->array, in_len);
  275. dst->len = new_len;
  276. dst->array[new_len] = 0;
  277. }
  278. void dstr_insert(struct dstr *dst, const size_t idx, const char *array)
  279. {
  280. size_t new_len, len;
  281. if (!array || !*array)
  282. return;
  283. if (idx == dst->len) {
  284. dstr_cat(dst, array);
  285. return;
  286. }
  287. len = strlen(array);
  288. new_len = dst->len + len;
  289. dstr_ensure_capacity(dst, new_len + 1);
  290. dst->len = new_len;
  291. memmove(dst->array+idx+len, dst->array+idx, dst->len - idx + 1);
  292. memcpy(dst->array+idx, array, len);
  293. }
  294. void dstr_insert_dstr(struct dstr *dst, const size_t idx,
  295. const struct dstr *str)
  296. {
  297. size_t new_len;
  298. if (!str->len)
  299. return;
  300. if (idx == dst->len) {
  301. dstr_cat_dstr(dst, str);
  302. return;
  303. }
  304. new_len = dst->len + str->len;
  305. dstr_ensure_capacity(dst, (new_len+1));
  306. dst->len = new_len;
  307. memmove(dst->array+idx+str->len, dst->array+idx, dst->len - idx + 1);
  308. memcpy(dst->array+idx, str->array, str->len);
  309. }
  310. void dstr_insert_ch(struct dstr *dst, const size_t idx, const char ch)
  311. {
  312. if (idx == dst->len) {
  313. dstr_cat_ch(dst, ch);
  314. return;
  315. }
  316. dstr_ensure_capacity(dst, (++dst->len+1));
  317. memmove(dst->array+idx+1, dst->array+idx, dst->len - idx + 1);
  318. dst->array[idx] = ch;
  319. }
  320. void dstr_remove(struct dstr *dst, const size_t idx, const size_t count)
  321. {
  322. size_t end;
  323. if (!count)
  324. return;
  325. if (count == dst->len) {
  326. dstr_free(dst);
  327. return;
  328. }
  329. end = idx+count;
  330. if (end == dst->len)
  331. dst->array[idx] = 0;
  332. else
  333. memmove(dst->array+idx, dst->array+end, dst->len - end + 1);
  334. dst->len -= count;
  335. }
  336. void dstr_printf(struct dstr *dst, const char *format, ...)
  337. {
  338. va_list args;
  339. va_start(args, format);
  340. dstr_vprintf(dst, format, args);
  341. va_end(args);
  342. }
  343. void dstr_catf(struct dstr *dst, const char *format, ...)
  344. {
  345. va_list args;
  346. va_start(args, format);
  347. dstr_vcatf(dst, format, args);
  348. va_end(args);
  349. }
  350. void dstr_vprintf(struct dstr *dst, const char *format, va_list args)
  351. {
  352. dstr_ensure_capacity(dst, 4096);
  353. vsnprintf(dst->array, 4095, format, args);
  354. if (!*dst->array) {
  355. dstr_free(dst);
  356. return;
  357. }
  358. dst->len = strlen(dst->array);
  359. }
  360. void dstr_vcatf(struct dstr *dst, const char *format, va_list args)
  361. {
  362. struct dstr temp;
  363. dstr_init(&temp);
  364. dstr_vprintf(&temp, format, args);
  365. dstr_cat_dstr(dst, &temp);
  366. dstr_free(&temp);
  367. }
  368. void dstr_safe_printf(struct dstr *dst, const char *format,
  369. const char *val1, const char *val2, const char *val3,
  370. const char *val4)
  371. {
  372. dstr_copy(dst, format);
  373. if (val1)
  374. dstr_replace(dst, "$1", val1);
  375. if (val2)
  376. dstr_replace(dst, "$2", val2);
  377. if (val3)
  378. dstr_replace(dst, "$3", val3);
  379. if (val4)
  380. dstr_replace(dst, "$4", val4);
  381. }
  382. void dstr_replace(struct dstr *str, const char *find,
  383. const char *replace)
  384. {
  385. size_t find_len, replace_len;
  386. char *temp;
  387. if (!replace)
  388. replace = "";
  389. find_len = strlen(find);
  390. replace_len = strlen(replace);
  391. temp = str->array;
  392. if (replace_len < find_len) {
  393. unsigned long count = 0;
  394. while ((temp = strstr(temp, find)) != NULL) {
  395. char *end = temp+find_len;
  396. size_t end_len = strlen(end);
  397. if (end_len) {
  398. memmove(temp+replace_len, end, end_len + 1);
  399. if (replace_len)
  400. memcpy(temp, replace, replace_len);
  401. } else {
  402. strcpy(temp, replace);
  403. }
  404. temp += replace_len;
  405. ++count;
  406. }
  407. if (count)
  408. str->len += (replace_len-find_len) * count;
  409. } else if (replace_len > find_len) {
  410. unsigned long count = 0;
  411. while ((temp = strstr(temp, find)) != NULL) {
  412. temp += find_len;
  413. ++count;
  414. }
  415. if (!count)
  416. return;
  417. str->len += (replace_len-find_len) * count;
  418. dstr_ensure_capacity(str, str->len + 1);
  419. temp = str->array;
  420. while ((temp = strstr(temp, find)) != NULL) {
  421. char *end = temp+find_len;
  422. size_t end_len = strlen(end);
  423. if (end_len) {
  424. memmove(temp+replace_len, end, end_len + 1);
  425. memcpy(temp, replace, replace_len);
  426. } else {
  427. strcpy(temp, replace);
  428. }
  429. temp += replace_len;
  430. }
  431. } else {
  432. while ((temp = strstr(temp, find)) != NULL) {
  433. memcpy(temp, replace, replace_len);
  434. temp += replace_len;
  435. }
  436. }
  437. }
  438. void dstr_depad(struct dstr *str)
  439. {
  440. if (str->array) {
  441. str->array = strdepad(str->array);
  442. if (*str->array)
  443. str->len = strlen(str->array);
  444. else
  445. dstr_free(str);
  446. }
  447. }
  448. void dstr_left(struct dstr *dst, const struct dstr *str, const size_t pos)
  449. {
  450. dstr_resize(dst, pos);
  451. if (dst != str)
  452. memcpy(dst->array, str->array, pos);
  453. }
  454. void dstr_mid(struct dstr *dst, const struct dstr *str, const size_t start,
  455. const size_t count)
  456. {
  457. struct dstr temp;
  458. dstr_init(&temp);
  459. dstr_copy_dstr(&temp, str);
  460. dstr_ncopy(dst, temp.array+start, count);
  461. dstr_free(&temp);
  462. }
  463. void dstr_right(struct dstr *dst, const struct dstr *str, const size_t pos)
  464. {
  465. struct dstr temp;
  466. dstr_init(&temp);
  467. dstr_ncopy(&temp, str->array+pos, str->len-pos);
  468. dstr_copy_dstr(dst, &temp);
  469. dstr_free(&temp);
  470. }
  471. void dstr_from_mbs(struct dstr *dst, const char *mbstr)
  472. {
  473. dstr_free(dst);
  474. dst->len = os_mbs_to_utf8_ptr(mbstr, 0, &dst->array);
  475. }
  476. char *dstr_to_mbs(const struct dstr *str)
  477. {
  478. char *dst;
  479. os_mbs_to_utf8_ptr(str->array, str->len, &dst);
  480. return dst;
  481. }
  482. void dstr_from_wcs(struct dstr *dst, const wchar_t *wstr)
  483. {
  484. size_t len = wchar_to_utf8(wstr, 0, NULL, 0, 0);
  485. if (len) {
  486. dstr_resize(dst, len);
  487. wchar_to_utf8(wstr, 0, dst->array, len+1, 0);
  488. } else {
  489. dstr_free(dst);
  490. }
  491. }