FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6262, 278 aa 1>>>pF1KE6262 278 - 278 aa - 278 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5983+/-0.000753; mu= 13.7163+/- 0.045 mean_var=64.3749+/-13.091, 0's: 0 Z-trim(108.5): 22 B-trim: 71 in 1/48 Lambda= 0.159851 statistics sampled from 10220 (10239) to 10220 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.694), E-opt: 0.2 (0.315), width: 16 Scan time: 1.720 The best scores are: opt bits E(32554) CCDS6178.1 TTPA gene_id:7274|Hs108|chr8 ( 278) 1860 437.3 5.9e-123 CCDS13332.2 TTPAL gene_id:79183|Hs108|chr20 ( 342) 563 138.2 7.8e-33 CCDS6176.1 CLVS1 gene_id:157807|Hs108|chr8 ( 354) 481 119.3 4e-27 CCDS34525.1 CLVS2 gene_id:134829|Hs108|chr6 ( 327) 480 119.0 4.4e-27 CCDS32324.1 RLBP1 gene_id:6017|Hs108|chr15 ( 317) 441 110.0 2.2e-24 CCDS10280.1 PTPN9 gene_id:5780|Hs108|chr15 ( 593) 310 79.9 4.7e-15 >>CCDS6178.1 TTPA gene_id:7274|Hs108|chr8 (278 aa) initn: 1860 init1: 1860 opt: 1860 Z-score: 2320.9 bits: 437.3 E(32554): 5.9e-123 Smith-Waterman score: 1860; 100.0% identity (100.0% similar) in 278 aa overlap (1-278:1-278) 10 20 30 40 50 60 pF1KE6 MAEARSQPSAGPQLNALPDHSPLLQPGLAALRRRAREAGVPLAPLPLTDSFLLRFLRARD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MAEARSQPSAGPQLNALPDHSPLLQPGLAALRRRAREAGVPLAPLPLTDSFLLRFLRARD 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 FDLDLAWRLLKNYYKWRAECPEISADLHPRSIIGLLKAGYHGVLRSRDPTGSKVLIYRIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 FDLDLAWRLLKNYYKWRAECPEISADLHPRSIIGLLKAGYHGVLRSRDPTGSKVLIYRIA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 HWDPKVFTAYDVFRVSLITSELIVQEVETQRNGIKAIFDLEGWQFSHAFQITPSVAKKIA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 HWDPKVFTAYDVFRVSLITSELIVQEVETQRNGIKAIFDLEGWQFSHAFQITPSVAKKIA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 AVLTDSFPLKVRGIHLINEPVIFHAVFSMIKPFLTEKIKERIHMHGNNYKQSLLQHFPDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 AVLTDSFPLKVRGIHLINEPVIFHAVFSMIKPFLTEKIKERIHMHGNNYKQSLLQHFPDI 190 200 210 220 230 240 250 260 270 pF1KE6 LPLEYGGEEFSMEDICQEWTNFIMKSEDYLSSISESIQ :::::::::::::::::::::::::::::::::::::: CCDS61 LPLEYGGEEFSMEDICQEWTNFIMKSEDYLSSISESIQ 250 260 270 >>CCDS13332.2 TTPAL gene_id:79183|Hs108|chr20 (342 aa) initn: 527 init1: 527 opt: 563 Z-score: 702.9 bits: 138.2 E(32554): 7.8e-33 Smith-Waterman score: 563; 39.2% identity (65.8% similar) in 240 aa overlap (30-268:60-295) 10 20 30 40 50 pF1KE6 MAEARSQPSAGPQLNALPDHSPLLQPGLAALRRRAREAGVPLAPLPLTDSFLLRFLRAR ::: .:. : : :.::::::::: CCDS13 GYVCSLTEDLVTKAREELQEKPEWRLRDVQALRDMVRKE-YPNLSTSLDDAFLLRFLRAR 30 40 50 60 70 80 60 70 80 90 100 110 pF1KE6 DFDLDLAWRLLKNYYKWRAECPEISADLHPRSIIGLLKAGYHGVLRSRDPTGSKVLIYRI :: : : .:: ::.. : ::. .:.: .. .: .:. :: :: : .:. : CCDS13 KFDYDRALQLLVNYHSCRRSWPEVFNNLKPSALKDVLASGFLTVLPHTDPRGCHVVCIRP 90 100 110 120 130 140 120 130 140 150 160 170 pF1KE6 AHWDPKVFTAYDVFRVSLITSELIVQEVETQRNGIKAIFDLEGWQFSHAFQITPSVAKKI .: :. . . .:. .: : ..: ::: ::: . : .: ..:.: .. : .:::. CCDS13 DRWIPSNYPITENIRAIYLTLEKLIQSEETQVNGIVILADYKGVSLSKASHFGPFIAKKV 150 160 170 180 190 200 180 190 200 210 220 230 pF1KE6 AAVLTDSFPLKVRGIHLINEPVIFHAVFSMIKPFLTEKIKERIHMHGNNYKQSLLQHFP- ..: :.::......:..::: ::...:..::::: ::: .:. .::.. . :: ..: CCDS13 IGILQDGFPIRIKAVHVVNEPRIFKGIFAIIKPFLKEKIANRFFLHGSDLN-SLHTNLPR 210 220 230 240 250 260 240 250 260 270 pF1KE6 DILPLEYGGEEFSMEDICQEWTNFIMKSEDYLSSISESIQ .::: :::: .. :. .. ::: CCDS13 SILPKEYGGTAGELDTAT--WNAVLLASEDDFVKEFCQPVPACDSILGQTLLPEGLTSDA 270 280 290 300 310 320 >>CCDS6176.1 CLVS1 gene_id:157807|Hs108|chr8 (354 aa) initn: 491 init1: 399 opt: 481 Z-score: 600.5 bits: 119.3 E(32554): 4e-27 Smith-Waterman score: 481; 38.4% identity (69.0% similar) in 203 aa overlap (49-247:73-273) 20 30 40 50 60 70 pF1KE6 DHSPLLQPGLAALRRRAREAGVPLAPLPLTDSFLLRFLRARDFDLDLAWRLLKNYYKWRA :.:.::::::: : :.::: .:...: CCDS61 NENPDVLHQDIQQVRDMIITRPDIGFLRTDDAFILRFLRARKFHQADAFRLLAQYFQYRQ 50 60 70 80 90 100 80 90 100 110 120 130 pF1KE6 ECPEISADLHPRSIIGLLKA---GYHGVLRSRDPTGSKVLIYRIAHWDPKVFTAYDVFRV .. ... . :. .: :. :::..:: : :.:. :.:: . . :..:. CCDS61 LNLDMFKNFKADDP-GIKRALIDGFPGVLENRDHYGRKILLLFAANWDQSRNSFTDILRA 110 120 130 140 150 160 140 150 160 170 180 190 pF1KE6 SLITSELIVQEVETQRNGIKAIFDLEGWQFSHAFQITPSVAKKIAAVLTDSFPLKVRGIH :.. :..... : : ::. :.: ...:..: ..:::. : : :::: . :.: CCDS61 ILLSLEVLIEDPELQINGFILIIDWSNFSFKQASKLTPSILKLAIEGLQDSFPARFGGVH 170 180 190 200 210 220 200 210 220 230 240 250 pF1KE6 LINEPVIFHAVFSMIKPFLTEKIKERIHMHGNNYKQSLLQHF-PDILPLEYGGEEFSMED ..:.: .::....::::: .: ..:: .:::: . :: : . :..:: :.:: CCDS61 FVNQPWYIHALYTLIKPFLKDKTRKRIFLHGNNLN-SLHQLIHPEFLPSEFGGTLPPYDM 230 240 250 260 270 280 260 270 pF1KE6 ICQEWTNFIMKSEDYLSSISESIQ CCDS61 GTWARTLLGPDYSDENDYTHTSYNAMHVKHTSSNLERECSPKLMKRSQSVVEAGTLKHEE 290 300 310 320 330 340 >>CCDS34525.1 CLVS2 gene_id:134829|Hs108|chr6 (327 aa) initn: 419 init1: 349 opt: 480 Z-score: 599.8 bits: 119.0 E(32554): 4.4e-27 Smith-Waterman score: 480; 39.1% identity (67.3% similar) in 202 aa overlap (49-247:51-251) 20 30 40 50 60 70 pF1KE6 DHSPLLQPGLAALRRRAREAGVPLAPLPLTDSFLLRFLRARDFDLDLAWRLLKNYYKWRA :.:.::::::: : :.::: .:...: CCDS34 NENPDTLHQDIQEVRDMVITRPDIGFLRTDDAFILRFLRARKFHHFEAFRLLAQYFEYRQ 30 40 50 60 70 80 80 90 100 110 120 130 pF1KE6 ECPEISADLHPRS--IIGLLKAGYHGVLRSRDPTGSKVLIYRIAHWDPKVFTAYDVFRVS . .. ... . : :: :. : : . : : :.:. :.:: . .: :..:. CCDS34 QNLDMFKSFKATDPGIKQALKDGFPGGLANLDHYGRKILVLFAANWDQSRYTLVDILRAI 90 100 110 120 130 140 140 150 160 170 180 190 pF1KE6 LITSELIVQEVETQRNGIKAIFDLEGWQFSHAFQITPSVAKKIAAVLTDSFPLKVRGIHL :.. : .... : : ::. :.: .. :..: ..:::. . : :::: . :::. CCDS34 LLSLEAMIEDPELQVNGFVLIIDWSNFTFKQASKLTPSMLRLAIEGLQDSFPARFGGIHF 150 160 170 180 190 200 200 210 220 230 240 250 pF1KE6 INEPVIFHAVFSMIKPFLTEKIKERIHMHGNNYKQSLLQHF-PDILPLEYGGEEFSMEDI .:.: .::....:.::: :: ..:: .:::: . :: : . :.::: :.:: CCDS34 VNQPWYIHALYTVIRPFLKEKTRKRIFLHGNNLN-SLHQLIHPEILPSEFGGMLPPYDMG 210 220 230 240 250 260 270 pF1KE6 CQEWTNFIMKSEDYLSSISESIQ CCDS34 TWARTLLDHEYDDDSEYNVDSYSMPVKEVEKELSPKSMKRSQSVVDPTVLKRMDKNEEEN 260 270 280 290 300 310 >>CCDS32324.1 RLBP1 gene_id:6017|Hs108|chr15 (317 aa) initn: 437 init1: 437 opt: 441 Z-score: 551.4 bits: 110.0 E(32554): 2.2e-24 Smith-Waterman score: 441; 32.7% identity (66.8% similar) in 226 aa overlap (24-247:66-291) 10 20 30 40 50 pF1KE6 MAEARSQPSAGPQLNALPDHSPLLQPGLAALRRRAREAGVPLAP-LPLTDS-F :: . : ..: .: .: . :: : CCDS32 PCSQLPRHTLQKAKDELNEREETREEAVRELQEMVQAQAASGEELAVAVAERVQEKDSGF 40 50 60 70 80 90 60 70 80 90 100 110 pF1KE6 LLRFLRARDFDLDLAWRLLKNYYKWRAECPEISADLHPRSIIGLLKAGYHGVLRSRDPTG .:::.::: :.. :..::..: ..: . ::. .: :... ..::: ::: ::: : CCDS32 FLRFIRARKFNVGRAYELLRGYVNFRLQYPELFDSLSPEAVRCTIEAGYPGVLSSRDKYG 100 110 120 130 140 150 120 130 140 150 160 170 pF1KE6 SKVLIYRIAHWDPKVFTAYDVFRVSLITSELIVQEVETQRNGIKAIFDLEGWQFSHAFQI :... : .:. . .: ..... . : .... ::: ::. : ...:. ...: .. CCDS32 RVVMLFNIENWQSQEITFDEILQAYCFILEKLLENEETQINGFCIIENFKGFTMQQAASL 160 170 180 190 200 210 180 190 200 210 220 230 pF1KE6 TPSVAKKIAAVLTDSFPLKVRGIHLINEPVIFHAVFSMIKPFLTEKIKERIHMHGNNYKQ : .:.. .: :::: . ..::.:..: : ......:::: :. ::. .::.. . CCDS32 RTSDLRKMVDMLQDSFPARFKAIHFIHQPWYFTTTYNVVKPFLKSKLLERVFVHGDDLSG 220 230 240 250 260 270 240 250 260 270 pF1KE6 SLLQHFPDILPLEYGGEEFSMEDICQEWTNFIMKSEDYLSSISESIQ . .::: ..:: CCDS32 FYQEIDENILPSDFGGTLPKYDGKAVAEQLFGPQAQAENTAF 280 290 300 310 >>CCDS10280.1 PTPN9 gene_id:5780|Hs108|chr15 (593 aa) initn: 267 init1: 167 opt: 310 Z-score: 383.7 bits: 79.9 E(32554): 4.7e-15 Smith-Waterman score: 310; 25.1% identity (60.1% similar) in 243 aa overlap (7-247:2-237) 10 20 30 40 50 60 pF1KE6 MAEARSQPSAGPQLNALPDHSPLLQPGLAALRRRAREAGVPLAPLPLTDSFLLRFLRARD .:...:. . :. .: . . . .. . : ::. . ..:: :: CCDS10 MEPATAPRPDMAPELTPEEEQATKQFLEEINKWTVQYNVSPLSWNVAVKFLMARK 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 FDLDLAWRLLKNYYKWRAECPEISADLHPRSIIGLLKAGYHGVLRSRDPTGSKVLIYRIA ::. : .:...: . : . .. : . . . . .: .: :::::... .. CCDS10 FDVLRAIELFHSYRETRRKEGIVKLKPHEEPLRSEILSGKFTILNVRDPTGASIALFTAR 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 HWDPKVFTAYDVFRVSLITSELIVQEVETQRNGIKAIFDLEGWQFSHAFQITPSVAKKIA :. . . :... . . :. ::::::. :.:. : .... :.. ...::. CCDS10 LHHPHKSVQHVVLQALFYLLDRAVDSFETQRNGLVFIYDMCGSNYAN-FEL--DLGKKVL 120 130 140 150 160 170 190 200 210 220 230 pF1KE6 AVLTDSFPLKVRGIHLINEPVIFHAVFSMIKPFLTEKIKERIHMHGNNYKQS-LLQHFP- .: .:: ... . ... :. :.. .:.:. .: .:..:::.. : : . ::.: CCDS10 NLLKGAFPARLKKVLIVGAPIWFRVPYSIISLLLKDKVRERIQI----LKTSEVTQHLPR 180 190 200 210 220 240 250 260 270 pF1KE6 DILPLEYGGEEFSMEDICQEWTNFIMKSEDYLSSISESIQ . :: . :: CCDS10 ECLPENLGGYVKIDLATWNFQFLPQVNGHPDPFDEIILFSLPPALDWDSVHVPGPHAMTI 230 240 250 260 270 280 278 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 11:35:10 2016 done: Tue Nov 8 11:35:10 2016 Total Scan time: 1.720 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]