dstr.c 11 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267268269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300301302303304305306307308309310311312313314315316317318319320321322323324325326327328329330331332333334335336337338339340341342343344345346347348349350351352353354355356357358359360361362363364365366367368369370371372373374375376377378379380381382383384385386387388389390391392393394395396397398399400401402403404405406407408409410411412413414415416417418419420421422423424425426427428429430431432433434435436437438439440441442443444445446447448449450451452453454455456457458459460461462463464465466467468469470471472473474475476477478479480481482483484485486487488489490491492493494495496497498499500501502503504505506507508509510511512513514515516517518519520521522523524525526527528529530531532533534535536537538539540541542543544545546547548549550551552553554555556557558559560561562563564565566567568569570571572573574575576577578579580581582583584585586587588589590
  1. /*
  2. * Copyright (c) 2013 Hugh Bailey <[email protected]>
  3. *
  4. * Permission to use, copy, modify, and distribute this software for any
  5. * purpose with or without fee is hereby granted, provided that the above
  6. * copyright notice and this permission notice appear in all copies.
  7. *
  8. * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
  9. * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
  10. * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
  11. * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
  12. * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
  13. * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
  14. * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
  15. */
  16. #include <stddef.h>
  17. #include <stdlib.h>
  18. #include <stdio.h>
  19. #include <string.h>
  20. #include <assert.h>
  21. #include <ctype.h>
  22. #include <wchar.h>
  23. #include "c99defs.h"
  24. #include "dstr.h"
  25. #include "bmem.h"
  26. #include "utf8.h"
  27. #include "lexer.h"
  28. #include "platform.h"
  29. static const char *astrblank = "";
  30. static const wchar_t *wstrblank = L"";
  31. int astrcmpi(const char *str1, const char *str2)
  32. {
  33. if (!str1)
  34. str1 = astrblank;
  35. if (!str2)
  36. str2 = astrblank;
  37. do {
  38. char ch1 = (char)toupper(*str1);
  39. char ch2 = (char)toupper(*str2);
  40. if (ch1 < ch2)
  41. return -1;
  42. else if (ch1 > ch2)
  43. return 1;
  44. } while (*str1++ && *str2++);
  45. return 0;
  46. }
  47. int wstrcmpi(const wchar_t *str1, const wchar_t *str2)
  48. {
  49. if (!str1)
  50. str1 = wstrblank;
  51. if (!str2)
  52. str2 = wstrblank;
  53. do {
  54. wchar_t ch1 = (wchar_t)towupper(*str1);
  55. wchar_t ch2 = (wchar_t)towupper(*str2);
  56. if (ch1 < ch2)
  57. return -1;
  58. else if (ch1 > ch2)
  59. return 1;
  60. } while (*str1++ && *str2++);
  61. return 0;
  62. }
  63. int astrcmp_n(const char *str1, const char *str2, size_t n)
  64. {
  65. if (!n)
  66. return 0;
  67. if (!str1)
  68. str1 = astrblank;
  69. if (!str2)
  70. str2 = astrblank;
  71. do {
  72. char ch1 = *str1;
  73. char ch2 = *str2;
  74. if (ch1 < ch2)
  75. return -1;
  76. else if (ch1 > ch2)
  77. return 1;
  78. } while (*str1++ && *str2++ && --n);
  79. return 0;
  80. }
  81. int wstrcmp_n(const wchar_t *str1, const wchar_t *str2, size_t n)
  82. {
  83. if (!n)
  84. return 0;
  85. if (!str1)
  86. str1 = wstrblank;
  87. if (!str2)
  88. str2 = wstrblank;
  89. do {
  90. wchar_t ch1 = *str1;
  91. wchar_t ch2 = *str2;
  92. if (ch1 < ch2)
  93. return -1;
  94. else if (ch1 > ch2)
  95. return 1;
  96. } while (*str1++ && *str2++ && --n);
  97. return 0;
  98. }
  99. int astrcmpi_n(const char *str1, const char *str2, size_t n)
  100. {
  101. if (!n)
  102. return 0;
  103. if (!str1)
  104. str1 = astrblank;
  105. if (!str2)
  106. str2 = astrblank;
  107. do {
  108. char ch1 = (char)toupper(*str1);
  109. char ch2 = (char)toupper(*str2);
  110. if (ch1 < ch2)
  111. return -1;
  112. else if (ch1 > ch2)
  113. return 1;
  114. } while (*str1++ && *str2++ && --n);
  115. return 0;
  116. }
  117. int wstrcmpi_n(const wchar_t *str1, const wchar_t *str2, size_t n)
  118. {
  119. if (!n)
  120. return 0;
  121. if (!str1)
  122. str1 = wstrblank;
  123. if (!str2)
  124. str2 = wstrblank;
  125. do {
  126. wchar_t ch1 = (wchar_t)towupper(*str1);
  127. wchar_t ch2 = (wchar_t)towupper(*str2);
  128. if (ch1 < ch2)
  129. return -1;
  130. else if (ch1 > ch2)
  131. return 1;
  132. } while (*str1++ && *str2++ && --n);
  133. return 0;
  134. }
  135. char *strdepad(char *str)
  136. {
  137. char *temp;
  138. size_t len;
  139. if (!str)
  140. return str;
  141. if (!*str)
  142. return str;
  143. temp = str;
  144. /* remove preceding spaces/tabs */
  145. while (*temp == ' ' || *temp == '\t')
  146. ++temp;
  147. len = strlen(str);
  148. if (temp != str)
  149. memmove(str, temp, len + 1);
  150. if (len) {
  151. temp = str + (len-1);
  152. while (*temp == ' ' || *temp == '\t')
  153. *(temp--) = 0;
  154. }
  155. return str;
  156. }
  157. wchar_t *wcsdepad(wchar_t *str)
  158. {
  159. wchar_t *temp;
  160. size_t len;
  161. if (!str)
  162. return str;
  163. if (!*str)
  164. return str;
  165. temp = str;
  166. /* remove preceding spaces/tabs */
  167. while (*temp == ' ' || *temp == '\t')
  168. ++temp;
  169. len = wcslen(str);
  170. if (temp != str)
  171. memmove(str, temp, (len+1) * sizeof(wchar_t));
  172. if (len) {
  173. temp = str + (len-1);
  174. while (*temp == ' ' || *temp == '\t')
  175. *(temp--) = 0;
  176. }
  177. return str;
  178. }
  179. void dstr_init_strref(struct dstr *dst, const struct strref *src)
  180. {
  181. dstr_init(dst);
  182. dstr_copy_strref(dst, src);
  183. }
  184. void dstr_copy(struct dstr *dst, const char *array)
  185. {
  186. size_t len;
  187. if (!array || !*array) {
  188. dstr_free(dst);
  189. return;
  190. }
  191. len = strlen(array);
  192. dstr_ensure_capacity(dst, len + 1);
  193. memcpy(dst->array, array, len + 1);
  194. dst->len = len;
  195. }
  196. void dstr_copy_strref(struct dstr *dst, const struct strref *src)
  197. {
  198. if (dst->array)
  199. dstr_free(dst);
  200. dstr_ncopy(dst, src->array, src->len);
  201. }
  202. static inline size_t size_min(size_t a, size_t b)
  203. {
  204. return (a < b) ? a : b;
  205. }
  206. void dstr_ncopy(struct dstr *dst, const char *array, const size_t len)
  207. {
  208. if (dst->array)
  209. dstr_free(dst);
  210. if (!len)
  211. return;
  212. dst->array = bmemdup(array, len + 1);
  213. dst->len = len;
  214. dst->array[len] = 0;
  215. }
  216. void dstr_ncopy_dstr(struct dstr *dst, const struct dstr *str, const size_t len)
  217. {
  218. size_t newlen;
  219. if (dst->array)
  220. dstr_free(dst);
  221. if (!len)
  222. return;
  223. newlen = size_min(len, str->len);
  224. dst->array = bmemdup(str->array, newlen + 1);
  225. dst->len = newlen;
  226. dst->array[newlen] = 0;
  227. }
  228. void dstr_cat_dstr(struct dstr *dst, const struct dstr *str)
  229. {
  230. size_t new_len;
  231. if (!str->len)
  232. return;
  233. new_len = dst->len + str->len;
  234. dstr_ensure_capacity(dst, new_len + 1);
  235. memcpy(dst->array+dst->len, str->array, str->len + 1);
  236. dst->len = new_len;
  237. }
  238. void dstr_cat_strref(struct dstr *dst, const struct strref *str)
  239. {
  240. dstr_ncat(dst, str->array, str->len);
  241. }
  242. void dstr_ncat(struct dstr *dst, const char *array, const size_t len)
  243. {
  244. size_t new_len;
  245. if (!array || !*array || !len)
  246. return;
  247. new_len = dst->len + len;
  248. dstr_ensure_capacity(dst, new_len + 1);
  249. memcpy(dst->array+dst->len, array, len);
  250. dst->len = new_len;
  251. dst->array[new_len] = 0;
  252. }
  253. void dstr_ncat_dstr(struct dstr *dst, const struct dstr *str, const size_t len)
  254. {
  255. size_t new_len, in_len;
  256. if (!str->array || !*str->array || !len)
  257. return;
  258. in_len = size_min(len, str->len);
  259. new_len = dst->len + in_len;
  260. dstr_ensure_capacity(dst, new_len + 1);
  261. memcpy(dst->array+dst->len, str->array, in_len);
  262. dst->len = new_len;
  263. dst->array[new_len] = 0;
  264. }
  265. void dstr_insert(struct dstr *dst, const size_t idx, const char *array)
  266. {
  267. size_t new_len, len;
  268. if (!array || !*array)
  269. return;
  270. if (idx == dst->len) {
  271. dstr_cat(dst, array);
  272. return;
  273. }
  274. len = strlen(array);
  275. new_len = dst->len + len;
  276. dstr_ensure_capacity(dst, new_len + 1);
  277. dst->len = new_len;
  278. memmove(dst->array+idx+len, dst->array+idx, dst->len - idx + 1);
  279. memcpy(dst->array+idx, array, len);
  280. }
  281. void dstr_insert_dstr(struct dstr *dst, const size_t idx,
  282. const struct dstr *str)
  283. {
  284. size_t new_len;
  285. if (!str->len)
  286. return;
  287. if (idx == dst->len) {
  288. dstr_cat_dstr(dst, str);
  289. return;
  290. }
  291. new_len = dst->len + str->len;
  292. dstr_ensure_capacity(dst, (new_len+1));
  293. dst->len = new_len;
  294. memmove(dst->array+idx+str->len, dst->array+idx, dst->len - idx + 1);
  295. memcpy(dst->array+idx, str->array, str->len);
  296. }
  297. void dstr_insert_ch(struct dstr *dst, const size_t idx, const char ch)
  298. {
  299. if (idx == dst->len) {
  300. dstr_cat_ch(dst, ch);
  301. return;
  302. }
  303. dstr_ensure_capacity(dst, (++dst->len+1));
  304. memmove(dst->array+idx+1, dst->array+idx, dst->len - idx + 1);
  305. dst->array[idx] = ch;
  306. }
  307. void dstr_remove(struct dstr *dst, const size_t idx, const size_t count)
  308. {
  309. size_t end;
  310. if (!count)
  311. return;
  312. if (count == dst->len) {
  313. dstr_free(dst);
  314. return;
  315. }
  316. end = idx+count;
  317. if (end == dst->len)
  318. dst->array[idx] = 0;
  319. else
  320. memmove(dst->array+idx, dst->array+end, dst->len - end + 1);
  321. dst->len -= count;
  322. }
  323. void dstr_printf(struct dstr *dst, const char *format, ...)
  324. {
  325. va_list args;
  326. va_start(args, format);
  327. dstr_vprintf(dst, format, args);
  328. va_end(args);
  329. }
  330. void dstr_catf(struct dstr *dst, const char *format, ...)
  331. {
  332. va_list args;
  333. va_start(args, format);
  334. dstr_vcatf(dst, format, args);
  335. va_end(args);
  336. }
  337. void dstr_vprintf(struct dstr *dst, const char *format, va_list args)
  338. {
  339. dstr_ensure_capacity(dst, 4096);
  340. vsnprintf(dst->array, 4095, format, args);
  341. if (!*dst->array) {
  342. dstr_free(dst);
  343. return;
  344. }
  345. dst->len = strlen(dst->array);
  346. }
  347. void dstr_vcatf(struct dstr *dst, const char *format, va_list args)
  348. {
  349. struct dstr temp;
  350. dstr_init(&temp);
  351. dstr_vprintf(&temp, format, args);
  352. dstr_cat_dstr(dst, &temp);
  353. dstr_free(&temp);
  354. }
  355. void dstr_safe_printf(struct dstr *dst, const char *format,
  356. const char *val1, const char *val2, const char *val3,
  357. const char *val4)
  358. {
  359. dstr_copy(dst, format);
  360. if (val1)
  361. dstr_replace(dst, "$1", val1);
  362. if (val2)
  363. dstr_replace(dst, "$2", val2);
  364. if (val3)
  365. dstr_replace(dst, "$3", val3);
  366. if (val4)
  367. dstr_replace(dst, "$4", val4);
  368. }
  369. void dstr_replace(struct dstr *str, const char *find,
  370. const char *replace)
  371. {
  372. size_t find_len, replace_len;
  373. char *temp;
  374. if (!replace)
  375. replace = "";
  376. find_len = strlen(find);
  377. replace_len = strlen(replace);
  378. temp = str->array;
  379. if (replace_len < find_len) {
  380. unsigned long count = 0;
  381. while ((temp = strstr(temp, find)) != NULL) {
  382. char *end = temp+find_len;
  383. size_t end_len = strlen(end);
  384. if (end_len) {
  385. memmove(temp+replace_len, end, end_len + 1);
  386. if (replace_len)
  387. memcpy(temp, replace, replace_len);
  388. } else {
  389. strcpy(temp, replace);
  390. }
  391. temp += replace_len;
  392. ++count;
  393. }
  394. if (count)
  395. str->len += (replace_len-find_len) * count;
  396. } else if (replace_len > find_len) {
  397. unsigned long count = 0;
  398. while ((temp = strstr(temp, find)) != NULL) {
  399. temp += find_len;
  400. ++count;
  401. }
  402. if (!count)
  403. return;
  404. str->len += (replace_len-find_len) * count;
  405. dstr_ensure_capacity(str, str->len + 1);
  406. temp = str->array;
  407. while ((temp = strstr(temp, find)) != NULL) {
  408. char *end = temp+find_len;
  409. size_t end_len = strlen(end);
  410. if (end_len) {
  411. memmove(temp+replace_len, end, end_len + 1);
  412. memcpy(temp, replace, replace_len);
  413. } else {
  414. strcpy(temp, replace);
  415. }
  416. temp += replace_len;
  417. }
  418. } else {
  419. while ((temp = strstr(temp, find)) != NULL) {
  420. memcpy(temp, replace, replace_len);
  421. temp += replace_len;
  422. }
  423. }
  424. }
  425. void dstr_depad(struct dstr *str)
  426. {
  427. if (str->array) {
  428. str->array = strdepad(str->array);
  429. if (*str->array)
  430. str->len = strlen(str->array);
  431. else
  432. dstr_free(str);
  433. }
  434. }
  435. void dstr_left(struct dstr *dst, const struct dstr *str, const size_t pos)
  436. {
  437. dstr_resize(dst, pos);
  438. if (dst != str)
  439. memcpy(dst->array, str->array, pos);
  440. }
  441. void dstr_mid(struct dstr *dst, const struct dstr *str, const size_t start,
  442. const size_t count)
  443. {
  444. struct dstr temp;
  445. dstr_init(&temp);
  446. dstr_copy_dstr(&temp, str);
  447. dstr_ncopy(dst, temp.array+start, count);
  448. dstr_free(&temp);
  449. }
  450. void dstr_right(struct dstr *dst, const struct dstr *str, const size_t pos)
  451. {
  452. struct dstr temp;
  453. dstr_init(&temp);
  454. dstr_ncopy(&temp, str->array+pos, str->len-pos);
  455. dstr_copy_dstr(dst, &temp);
  456. dstr_free(&temp);
  457. }
  458. void dstr_from_mbs(struct dstr *dst, const char *mbstr)
  459. {
  460. dstr_free(dst);
  461. dst->len = os_mbs_to_utf8(mbstr, 0, &dst->array);
  462. }
  463. char *dstr_to_mbs(const struct dstr *str)
  464. {
  465. char *dst;
  466. os_mbs_to_utf8(str->array, str->len, &dst);
  467. return dst;
  468. }
  469. void dstr_from_wcs(struct dstr *dst, const wchar_t *wstr)
  470. {
  471. size_t len = wchar_to_utf8(wstr, 0, NULL, 0, 0);
  472. if (len) {
  473. dstr_resize(dst, len);
  474. wchar_to_utf8(wstr, 0, dst->array, len+1, 0);
  475. } else {
  476. dstr_free(dst);
  477. }
  478. }