(正規表現でリンク部分を抜き出す時に「<a href=".+?twitter.+?</a>」とやればツイッターの部分を抜き出せる...と思ったのだけど、その行に他にもリンクがある場合、そこまで選択されてしまう。その特定1リンク部分だけ抽出ってできないのかな。色々考えたけどアウト
— Raizo Fuwa(不破雷蔵) (@Fuwarin) June 16, 2013
......ということで先日から悩んでいるのがこの問題。正規表現を使ってブログの記事から特定ドメインを持つURLのリンクを抽出し、それを「[これはリンク切れでーす]」的な文字列に置き換えたい。
でも上記の表現だと、1段落に複数のリンクがあった場合、両方とも一挙に選択してしまうのよね。【第IV部~テキスト編集を極める!! 正規表現について】の「[2-1] 「置換・削除」と「最長一致のルール」 ...うわぁ!みんな消えちまった!!」あたりにヒントがありそうな気がするのだけど......やっぱり当方は付け焼刃だったので無理でした(´・ω・`)
↑ こんな感じで余計なところまでまとめて指定されてしまう
どなたかわかる方がおられましたらお教えくださいると幸いですm(__)m
コメントする