请教大家一个复杂的正则表达式的问题，即如何匹配 Markdown 文件中嵌套的 HTML 表格中的 Markdown 语法的链接和加粗内容。

myscarh · 2020-02-02T17:58:57Z

目标 Markdown 文件是类似这样的： sdfsdf //不能被匹配的单元格 wee sdfsdfsdf ** 需要被匹配的粗体** sd[需要被匹配的链接]( http)sdfsd 两边有空格其他 HTML 标签 abc ## Markdown 语法的部分 [不能被匹配的链接]( http) **不能被匹配的粗体** aa sdfsdf 不能被匹配的单元格 sdfsdf wee sdfsdf 不能被匹配的单元格 sdfsdf wee ** 需要被匹配的粗体** sd[需要被匹配的链接]( http)sdfsdsdfsdf 其他 HTML 标签 abc sdfsdfsdf //不能被匹配的单元格 asdasd 要求是不能匹配没有 Markdown 加粗或链接的 HTML 单元格，而且返回结果除了 , [, ], (和)以外必须被分组捕捉以用于批量替换。可以一次只匹配一个单元格中的一个 Markdown 链接或加粗内容，然后多次替换来解决，但是 HTML 表格之外的 Markdown 链接不能被匹配。我之前尝试用 ]*?)>([\s\S]*?)\[(.*?)\]$(.*?)$([\s\S]*?) 替换成 $2 $3 $5 ，但是([\s\S\n]*?)会匹配表格外的内容。目前看难点在于如何匹配 ]*?)>和\[(.*?)\]$(.*?)$之间所有内容（包括换行和空格），如果存在则不匹配该单元格请问该使用什么样的正则表达式。

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

This topic created in 2364 days ago, the information mentioned may be changed or developed.

目标 Markdown 文件是类似这样的：

<td sda> sdfsdf
//不能被匹配的单元格
wee</td>
<td sdff>sdfsdfsdf
** 需要被匹配的粗体**
sd[需要被匹配的链接]( http)sdfsd
两边有空格
<p>其他 HTML 标签 <br/>abc</p>
</td>
</table>
## Markdown 语法的部分
[不能被匹配的链接]( http)
**不能被匹配的粗体**
<table>
<th>aa</th
<td> sdfsdf 不能被匹配的单元格 sdfsdf
wee</td>
<td> sdfsdf 不能被匹配的单元格 sdfsdf

wee</td>
<td> ** 需要被匹配的粗体**
sd[需要被匹配的链接]( http)sdfsdsdfsdf
<p> 其他 HTML 标签 <br/>abc </p>
</td>
<td sdff>sdfsdfsdf

//不能被匹配的单元格
<b>asdasd</b>
</td>

要求是不能匹配没有 Markdown 加粗或链接的 HTML 单元格，而且返回结果除了<td, </td>, [, ], (和)以外必须被分组捕捉以用于批量替换。
可以一次只匹配一个单元格中的一个 Markdown 链接或加粗内容，然后多次替换来解决，但是 HTML 表格之外的 Markdown 链接不能被匹配。
我之前尝试用<td([^>]*?)>([\s\S]*?)\[(.*?)\]$(.*?)$([\s\S]*?)<\/td>替换成<td$1>$2<a href="$4">$3</a>$5</td>，但是([\s\S\n]*?)会匹配表格外的内容。
目前看难点在于如何匹配<td([^>]*?)>和\[(.*?)\]$(.*?)$之间所有内容（包括换行和空格），如果存在</td>则不匹配该单元格

请问该使用什么样的正则表达式。

匹配

Markdown

sdfsdf

HTML

10 replies • 2020-02-04 05:42:12 +08:00