Subscribed unsubscribe Subscribe Subscribe

CPSAM.org

computer, programming, statistics and more!

fasta整形

簡単にいうとbiomartからとってきたutr sequenceが改行されていて大変だったという話

改行の置換はsedは苦手らしい

cat martquery.txt | tr -d "\n" > out

sed -E "s/>/\n>/g" out >  out2
sed -E "s/([0-9]){1}([AGCTS])/\1,\2/g" out2 > out3
sed -E "s/^>//" out3 > out4
sed -E "s/\|/,/" out4 > utr.csv
Remove all ads