FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KSDA0198, 496 aa 1>>>pF1KSDA0198 496 - 496 aa - 496 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.4356+/-0.000995; mu= 0.0134+/- 0.058 mean_var=321.7852+/-72.098, 0's: 0 Z-trim(114.4): 719 B-trim: 830 in 1/51 Lambda= 0.071498 statistics sampled from 14053 (14954) to 14053 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.785), E-opt: 0.2 (0.459), width: 16 Scan time: 3.740 The best scores are: opt bits E(32554) CCDS13197.1 PLAGL2 gene_id:5326|Hs108|chr20 ( 496) 3453 370.0 3.3e-102 CCDS6165.1 PLAG1 gene_id:5324|Hs108|chr8 ( 500) 1452 163.6 4.6e-40 CCDS47860.1 PLAG1 gene_id:5324|Hs108|chr8 ( 418) 1278 145.6 1e-34 CCDS5202.1 PLAGL1 gene_id:5325|Hs108|chr6 ( 463) 1260 143.8 4e-34 CCDS5203.1 PLAGL1 gene_id:5325|Hs108|chr6 ( 411) 1096 126.8 4.5e-29 >>CCDS13197.1 PLAGL2 gene_id:5326|Hs108|chr20 (496 aa) initn: 3453 init1: 3453 opt: 3453 Z-score: 1948.3 bits: 370.0 E(32554): 3.3e-102 Smith-Waterman score: 3453; 100.0% identity (100.0% similar) in 496 aa overlap (1-496:1-496) 10 20 30 40 50 60 pF1KSD MTTFFTSVPPWIQDAKQEEEVGWKLVPRPRGREAESQVKCQCEISGTPFSNGEKLRPHSL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 MTTFFTSVPPWIQDAKQEEEVGWKLVPRPRGREAESQVKCQCEISGTPFSNGEKLRPHSL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KSD PQPEQRPYSCPQLHCGKAFASKYKLYRHMATHSAQKPHQCMYCDKMFHRKDHLRNHLQTH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 PQPEQRPYSCPQLHCGKAFASKYKLYRHMATHSAQKPHQCMYCDKMFHRKDHLRNHLQTH 70 80 90 100 110 120 130 140 150 160 170 180 pF1KSD DPNKEALHCSECGKNYNTKLGYRRHLAMHAASSGDLSCKVCLQTFESTQALLEHLKAHSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 DPNKEALHCSECGKNYNTKLGYRRHLAMHAASSGDLSCKVCLQTFESTQALLEHLKAHSR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KSD RVAGGAKEKKHPCDHCDRRFYTRKDVRRHLVVHTGRKDFLCQYCAQRFGRKDHLTRHVKK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 RVAGGAKEKKHPCDHCDRRFYTRKDVRRHLVVHTGRKDFLCQYCAQRFGRKDHLTRHVKK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KSD SHSQELLKIKTEPVDMLGLLSCSSTVSVKEELSPVLCMASRDVMGTKAFPGMLPMGMYGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SHSQELLKIKTEPVDMLGLLSCSSTVSVKEELSPVLCMASRDVMGTKAFPGMLPMGMYGA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KSD HIPTMPSTGVPHSLVHNTLPMGMSYPLESSPISSPAQLPPKYQLGSTSYLPDKLPKVEVD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 HIPTMPSTGVPHSLVHNTLPMGMSYPLESSPISSPAQLPPKYQLGSTSYLPDKLPKVEVD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KSD SFLAELPGSLSLSSAEPQPASPQPAAAAALLDEALLAKSPANLSEALCAANVDFSHLLGF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 SFLAELPGSLSLSSAEPQPASPQPAAAAALLDEALLAKSPANLSEALCAANVDFSHLLGF 370 380 390 400 410 420 430 440 450 460 470 480 pF1KSD LPLNLPPCNPPGATGGLVMGYSQAEAQPLLTTLQAQPQDSPGAGGPLNFGPLHSLPPVFT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS13 LPLNLPPCNPPGATGGLVMGYSQAEAQPLLTTLQAQPQDSPGAGGPLNFGPLHSLPPVFT 430 440 450 460 470 480 490 pF1KSD SGLSSTTLPRFHQAFQ :::::::::::::::: CCDS13 SGLSSTTLPRFHQAFQ 490 >>CCDS6165.1 PLAG1 gene_id:5324|Hs108|chr8 (500 aa) initn: 1642 init1: 1232 opt: 1452 Z-score: 832.8 bits: 163.6 E(32554): 4.6e-40 Smith-Waterman score: 1709; 52.0% identity (75.2% similar) in 504 aa overlap (6-496:3-500) 10 20 30 40 50 60 pF1KSD MTTFFTSVPPWIQDAKQEEEVGWKLVPRPRGREAESQVKCQCEISGTPFSNGEKLRPHSL : .: ...... ..: : :: :.. . . :.. :.. :::. :: CCDS61 MATVIPGDLSEVRDTQKV--PSGKRKRG-ETKPRKNFPCQLCDKAFNSVEKLKVHSY 10 20 30 40 50 70 80 90 100 110 120 pF1KSD PQPEQRPYSCPQLHCGKAFASKYKLYRHMATHSAQKPHQCMYCDKMFHRKDHLRNHLQTH . .:::.: : : :::.::::: ::::::: .: :.: ::.:::::::::.:::.:: CCDS61 SHTGERPYKCIQQDCTKAFVSKYKLQRHMATHSPEKTHKCNYCEKMFHRKDHLKNHLHTH 60 70 80 90 100 110 130 140 150 160 170 180 pF1KSD DPNKEALHCSECGKNYNTKLGYRRHLAMHAASSGDLSCKVCLQTFESTQALLEHLKAHSR :::::...: :::::::::::..::::.:::.::::.::::::::::: .::::::.:. CCDS61 DPNKETFKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSHAG 120 130 140 150 160 170 190 200 210 220 230 240 pF1KSD RVAGGAKEKKHPCDHCDRRFYTRKDVRRHLVVHTGRKDFLCQYCAQRFGRKDHLTRHVKK . .::.::::: :.:::::::::::::::.:::::::::::::::::::::::::::.:: CCDS61 KSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHMKK 180 190 200 210 220 230 250 260 270 280 290 300 pF1KSD SHSQELLKIKTEPVDMLGLLSCSSTVSVKEELSPVLCMASRDVMGTKAFPGMLPMGMYGA ::.:::::.::::::.: ..:. .: .:.:: ::. . : ... .: : . : ...:.. CCDS61 SHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSELL-SKPFTNTLQLNLYNT 240 250 260 270 280 290 310 320 330 340 350 pF1KSD HIPTMPSTGVPHSLVHNTLPMGMSYPLESSPISSPAQLPPKYQLGSTSY---LPDK-LP- . .: :.: :... .:::.::. :.. . . .: :: ..:::: .:.: : CCDS61 PFQSMQSSGSAHQMI-TTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQPL 300 310 320 330 340 350 360 370 380 390 400 pF1KSD KVEVDSFLAELPGSLSLSSAEPQPAS-------PQPAAAAALLDEALLAKSPANLSEALC : :..:.: :: :.. :: . : .: :: .. . :.:: ..:. : CCDS61 KGEIESYLMELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDPLN 360 370 380 390 400 410 410 420 430 440 450 460 pF1KSD AANVDFSHLLGFLPLNLPPCNPPGATGGLVMGYSQAEAQPLLTTLQAQPQDSPGAGGPLN . .:::.:..:.::: :: :: ..:.: :.::: ::. .. : : :: .. .. CCDS61 TPALDFSQLFNFIPLNGPPYNPL-SVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANTIG 420 430 440 450 460 470 470 480 490 pF1KSD FGPLHSLPPVFTSGLS-STTLPRFHQAFQ .: :::: .:::.:: :::::::::::: CCDS61 LGSLHSLSAAFTSSLSTSTTLPRFHQAFQ 480 490 500 >>CCDS47860.1 PLAG1 gene_id:5324|Hs108|chr8 (418 aa) initn: 1557 init1: 1088 opt: 1278 Z-score: 736.8 bits: 145.6 E(32554): 1e-34 Smith-Waterman score: 1535; 55.1% identity (77.7% similar) in 421 aa overlap (89-496:1-418) 60 70 80 90 100 110 pF1KSD SLPQPEQRPYSCPQLHCGKAFASKYKLYRHMATHSAQKPHQCMYCDKMFHRKDHLRNHLQ ::::: .: :.: ::.:::::::::.:::. CCDS47 MATHSPEKTHKCNYCEKMFHRKDHLKNHLH 10 20 30 120 130 140 150 160 170 pF1KSD THDPNKEALHCSECGKNYNTKLGYRRHLAMHAASSGDLSCKVCLQTFESTQALLEHLKAH :::::::...: :::::::::::..::::.:::.::::.::::::::::: .::::::.: CCDS47 THDPNKETFKCEECGKNYNTKLGFKRHLALHAATSGDLTCKVCLQTFESTGVLLEHLKSH 40 50 60 70 80 90 180 190 200 210 220 230 pF1KSD SRRVAGGAKEKKHPCDHCDRRFYTRKDVRRHLVVHTGRKDFLCQYCAQRFGRKDHLTRHV . . .::.::::: :.:::::::::::::::.:::::::::::::::::::::::::::. CCDS47 AGKSSGGVKEKKHQCEHCDRRFYTRKDVRRHMVVHTGRKDFLCQYCAQRFGRKDHLTRHM 100 110 120 130 140 150 240 250 260 270 280 290 pF1KSD KKSHSQELLKIKTEPVDMLGLLSCSSTVSVKEELSPVLCMASRDVMGTKAFPGMLPMGMY ::::.:::::.::::::.: ..:. .: .:.:: ::. . : ... .: : . : ...: CCDS47 KKSHNQELLKVKTEPVDFLDPFTCNVSVPIKDELLPVMSLPSSELL-SKPFTNTLQLNLY 160 170 180 190 200 300 310 320 330 340 350 pF1KSD GAHIPTMPSTGVPHSLVHNTLPMGMSYPLESSPISSPAQLPPKYQLGSTSY---LPDK-L .. . .: :.: :... .:::.::. :.. . . .: :: ..:::: .:.: CCDS47 NTPFQSMQSSGSAHQMI-TTLPLGMTCPIDMDTVHPSHHLSFKYPFSSTSYAISIPEKEQ 210 220 230 240 250 260 360 370 380 390 400 pF1KSD P-KVEVDSFLAELPGSLSLSSAEPQPAS-------PQPAAAAALLDEALLAKSPANLSEA : : :..:.: :: :.. :: . : .: :: .. . :.:: ..:. CCDS47 PLKGEIESYLMELQGGVPSSSQDSQASSSSKLGLDPQIGSLDDGAGDLSLSKSSISISDP 270 280 290 300 310 320 410 420 430 440 450 460 pF1KSD LCAANVDFSHLLGFLPLNLPPCNPPGATGGLVMGYSQAEAQPLLTTLQAQPQDSPGAGGP : . .:::.:..:.::: :: :: ..:.: :.::: ::. .. : : :: .. CCDS47 LNTPALDFSQLFNFIPLNGPPYNPL-SVGSLGMSYSQEEAHSSVSQLPPQTQDLQDPANT 330 340 350 360 370 380 470 480 490 pF1KSD LNFGPLHSLPPVFTSGLS-STTLPRFHQAFQ ...: :::: .:::.:: :::::::::::: CCDS47 IGLGSLHSLSAAFTSSLSTSTTLPRFHQAFQ 390 400 410 >>CCDS5202.1 PLAGL1 gene_id:5325|Hs108|chr6 (463 aa) initn: 728 init1: 614 opt: 1260 Z-score: 726.2 bits: 143.8 E(32554): 4e-34 Smith-Waterman score: 1260; 46.2% identity (68.6% similar) in 468 aa overlap (42-496:6-463) 20 30 40 50 60 70 pF1KSD IQDAKQEEEVGWKLVPRPRGREAESQVKCQCEISGTPFSNGEKLRPHSLPQPEQRPYSCP :.. : : . ::. :. . ..:::.: CCDS52 MATFPCQLCGKTFLTLEKFTIHNYSHSRERPYKCV 10 20 30 80 90 100 110 120 130 pF1KSD QLHCGKAFASKYKLYRHMATHSAQKPHQCMYCDKMFHRKDHLRNHLQTHDPNKEALHCSE : :::::.:.:::.::::::: :: ::: .:.: :.:::::.:::::::::: :. : : CCDS52 QPDCGKAFVSRYKLMRHMATHSPQKSHQCAHCEKTFNRKDHLKNHLQTHDPNKMAFGCEE 40 50 60 70 80 90 140 150 160 170 180 190 pF1KSD CGKNYNTKLGYRRHLAMHAASSGDLSCKVCLQTFESTQALLEHLKAHSR-RVAGGAKEKK :::.::: :::.::::.::::::::.: :: . ::..::.:::::.. . .:.:::: CCDS52 CGKKYNTMLGYKRHLALHAASSGDLTCGVCALELGSTEVLLDHLKAHAEEKPPSGTKEKK 100 110 120 130 140 150 200 210 220 230 240 250 pF1KSD HPCDHCDRRFYTRKDVRRHLVVHTGRKDFLCQYCAQRFGRKDHLTRHVKKSHSQELLKIK : ::::.: :::::::::::::::: ::::::.::::::::::::::.::.:::::.: . CCDS52 HQCDHCERCFYTRKDVRRHLVVHTGCKDFLCQFCAQRFGRKDHLTRHTKKTHSQELMKES 160 170 180 190 200 210 260 270 280 290 300 pF1KSD TEPVDMLGLL-SCSSTVSVKEELSPVLCMASRDVMG-TKAFPGML-PMGMYGAHIPTMPS . :.:. . . : . ..: : . ... : ....:. . . . . ..: CCDS52 LQTGDLLSTFHTISPSFQLKAAALPPFPLGASAQNGLASSLPAEVHSLTLSPPEQAAQPM 220 230 240 250 260 270 310 320 330 340 350 360 pF1KSD TGVPHSLVHNTLPMGMSYPLESSPISSPAQLPP-KYQLGSTSYLP-DKLP-KVEVDSFLA .:.::. .: .: :: : : :: ::. :::: : .:: :... .: CCDS52 QPLPESLA--SL-----HP-SVSPGSPPPPLPNHKYNTTSTSYSPLASLPLKADTKGFCN 280 290 300 310 320 370 380 390 400 410 420 pF1KSD -ELPGSLSLSSAE-PQPASPQPAAAAALLDEALLAKS-PANLSEALCAANVDFSHLLGFL : .: :. . :: .: : . .. : : ::. . :..:.: :::: CCDS52 ISLFEDLPLQEPQSPQKLNPGFDLAKGNAGKVNLPKELPADAVNLTIPASLDLSPLLGF- 330 340 350 360 370 380 430 440 450 460 470 pF1KSD PLNLPPCNPPGATGGLVMGYSQAEAQPL-LTTLQAQPQDSPGAGGPLNFG--PLHSLPPV .::: .. :. ... . .:. : :. : : :. : : : ...: :: .: : CCDS52 -WQLPPPATQNTFGNSTLALGPGESLPHRLSCLGQQQQEPPLAMGTVSLGQLPLPPIPHV 390 400 410 420 430 440 480 490 pF1KSD FTSGLSSTTLPRFHQAFQ :..: .:. ::.::.::. CCDS52 FSAGTGSAILPHFHHAFR 450 460 >>CCDS5203.1 PLAGL1 gene_id:5325|Hs108|chr6 (411 aa) initn: 588 init1: 473 opt: 1096 Z-score: 635.4 bits: 126.8 E(32554): 4.5e-29 Smith-Waterman score: 1096; 46.1% identity (68.2% similar) in 421 aa overlap (89-496:1-411) 60 70 80 90 100 110 pF1KSD SLPQPEQRPYSCPQLHCGKAFASKYKLYRHMATHSAQKPHQCMYCDKMFHRKDHLRNHLQ ::::: :: ::: .:.: :.:::::.:::: CCDS52 MATHSPQKSHQCAHCEKTFNRKDHLKNHLQ 10 20 30 120 130 140 150 160 170 pF1KSD THDPNKEALHCSECGKNYNTKLGYRRHLAMHAASSGDLSCKVCLQTFESTQALLEHLKAH :::::: :. : ::::.::: :::.::::.::::::::.: :: . ::..::.::::: CCDS52 THDPNKMAFGCEECGKKYNTMLGYKRHLALHAASSGDLTCGVCALELGSTEVLLDHLKAH 40 50 60 70 80 90 180 190 200 210 220 230 pF1KSD SR-RVAGGAKEKKHPCDHCDRRFYTRKDVRRHLVVHTGRKDFLCQYCAQRFGRKDHLTRH .. . .:.::::: ::::.: :::::::::::::::: ::::::.:::::::::::::: CCDS52 AEEKPPSGTKEKKHQCDHCERCFYTRKDVRRHLVVHTGCKDFLCQFCAQRFGRKDHLTRH 100 110 120 130 140 150 240 250 260 270 280 290 pF1KSD VKKSHSQELLKIKTEPVDMLGLL-SCSSTVSVKEELSPVLCMASRDVMG-TKAFPGML-P .::.:::::.: . . :.:. . . : . ..: : . ... : ....:. . CCDS52 TKKTHSQELMKESLQTGDLLSTFHTISPSFQLKAAALPPFPLGASAQNGLASSLPAEVHS 160 170 180 190 200 210 300 310 320 330 340 350 pF1KSD MGMYGAHIPTMPSTGVPHSLVHNTLPMGMSYPLESSPISSPAQLPP-KYQLGSTSYLP-D . . . ..: .:.::. .: .: :: : : :: ::. :::: : CCDS52 LTLSPPEQAAQPMQPLPESLA--SL-----HP-SVSPGSPPPPLPNHKYNTTSTSYSPLA 220 230 240 250 260 360 370 380 390 400 pF1KSD KLP-KVEVDSFLA-ELPGSLSLSSAE-PQPASPQPAAAAALLDEALLAKS-PANLSEALC .:: :... .: : .: :. . :: .: : . .. : : ::. . CCDS52 SLPLKADTKGFCNISLFEDLPLQEPQSPQKLNPGFDLAKGNAGKVNLPKELPADAVNLTI 270 280 290 300 310 320 410 420 430 440 450 460 pF1KSD AANVDFSHLLGFLPLNLPPCNPPGATGGLVMGYSQAEAQPL-LTTLQAQPQDSPGAGGPL :..:.: :::: .::: .. :. ... . .:. : :. : : :. : : : . CCDS52 PASLDLSPLLGF--WQLPPPATQNTFGNSTLALGPGESLPHRLSCLGQQQQEPPLAMGTV 330 340 350 360 370 380 470 480 490 pF1KSD NFG--PLHSLPPVFTSGLSSTTLPRFHQAFQ ..: :: .: ::..: .:. ::.::.::. CCDS52 SLGQLPLPPIPHVFSAGTGSAILPHFHHAFR 390 400 410 496 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Thu Nov 3 00:35:39 2016 done: Thu Nov 3 00:35:40 2016 Total Scan time: 3.740 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]