FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KB4894, 407 aa
1>>>pF1KB4894 407 - 407 aa - 407 aa
Library: /omim/omim.rfq.tfa
60827320 residues in 85289 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.8125+/-0.000305; mu= 15.2799+/- 0.019
mean_var=84.4690+/-16.436, 0's: 0 Z-trim(118.1): 7 B-trim: 11 in 1/52
Lambda= 0.139549
statistics sampled from 30800 (30807) to 30800 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.721), E-opt: 0.2 (0.361), width: 16
Scan time: 9.880
The best scores are: opt bits E(85289)
NP_065852 (OMIM: 612464) arrestin domain-containin ( 414) 1449 301.3 2.9e-81
NP_006463 (OMIM: 606599) thioredoxin-interacting p ( 391) 891 188.9 1.9e-47
XP_016855574 (OMIM: 606599) PREDICTED: thioredoxin ( 395) 876 185.9 1.5e-46
NP_001300901 (OMIM: 606599) thioredoxin-interactin ( 336) 776 165.7 1.5e-40
NP_001316599 (OMIM: 612464) arrestin domain-contai ( 194) 699 150.1 4.5e-36
NP_001316601 (OMIM: 612464) arrestin domain-contai ( 194) 699 150.1 4.5e-36
NP_001316600 (OMIM: 612464) arrestin domain-contai ( 194) 699 150.1 4.5e-36
>>NP_065852 (OMIM: 612464) arrestin domain-containing pr (414 aa)
initn: 1434 init1: 951 opt: 1449 Z-score: 1579.8 bits: 301.3 E(85289): 2.9e-81
Smith-Waterman score: 1449; 53.6% identity (78.9% similar) in 412 aa overlap (1-404:1-411)
10 20 30 40 50 60
pF1KB4 MLFDKVKAFSVQLDGATAGVEPVFSGGQAVAGRVLLELSSAARVGALRLRARGRAHVHWT
:.. :::......: . . ::.:.:..:.::: ::... :: .:...:::.:.:.::
NP_065 MVLGKVKSLTISFDCLNDSNVPVYSSGDTVSGRVNLEVTGEIRVKSLKIHARGHAKVRWT
10 20 30 40 50 60
70 80 90 100 110
pF1KB4 ESRSAGSSTAYTQSYSERVEVVSHRATLLA----PDTGETT--TLPPGRHEFLFSFQLPP
:::.:::.:::::.:.:.:: .:. :.. :..: :. ::::. :::.::
NP_065 ESRNAGSNTAYTQNYTEEVEYFNHKDILIGHERDDDNSEEGFHTIHSGRHEYAFSFELPQ
70 80 90 100 110 120
120 130 140 150 160 170
pF1KB4 T-LVTSFEGKHGSVRYCIKATLHRPWVPARRARKVFTVIEPVDINTPALLAPQAGAREKV
: :.:::::.:::::: .:: :::::. . .: :::.: .:::::.::.::::..::.
NP_065 TPLATSFEGRHGSVRYWVKAELHRPWLLPVKLKKEFTVFEHIDINTPSLLSPQAGTKEKT
130 140 150 160 170 180
180 190 200 210 220 230
pF1KB4 ARSWYCNRGLVSLSAKIDRKGYTPGEVIPVFAEIDNGSTRPVLPRAAVVQTQTFMARGAR
:.:. : .::::::.:::::::: : .::::.: :.: :.:.::. :::.:.:.:
NP_065 LCCWFCTSGPISLSAKIERKGYTPGESIQIFAEIENCSSRMVVPKAAIYQTQAFYAKGKM
190 200 210 220 230 240
240 250 260 270 280 290
pF1KB4 KQKRAVVASLAGEPVGPGQRALWQGRALRIPPVGPSILHCRVLHVDYALKVCVDIPGTSK
:. . .::.: :: .. :. :.:. :.::::.:::: : ...:.:.: : :::::.
NP_065 KEVKQLVANLRGESLSSGKTETWNGKLLKIPPVSPSILDCSIIRVEYSLMVYVDIPGAMD
250 260 270 280 290 300
300 310 320 330 340 350
pF1KB4 LLLELPLVIGTIPLHPFGSRSSSVGSHASFLLDWRLGALPERPEAPPEYSEVVADTEEAA
:.:.::::::::::::::::.:::.:. :. ..: .::::::::: :.:::.. :.
NP_065 LFLNLPLVIGTIPLHPFGSRTSSVSSQCSMNMNWLSLSLPERPEAPPSYAEVVTE-EQRR
310 320 330 340 350
360 370 380 390 400
pF1KB4 LGQSPFPLPQDPDMSLEGPFFAYIQEFRYRPPPLYSEEDPNP-LLGDMRPRCMTC
. .: .: . .:.::.::::::::. ::::::: :::: .: :: :
NP_065 NNLAPVSACDDFERALQGPLFAYIQEFRFLPPPLYSEIDPNPDQSADDRPSCPSR
360 370 380 390 400 410
>>NP_006463 (OMIM: 606599) thioredoxin-interacting prote (391 aa)
initn: 808 init1: 529 opt: 891 Z-score: 973.0 bits: 188.9 E(85289): 1.9e-47
Smith-Waterman score: 891; 38.6% identity (66.2% similar) in 399 aa overlap (1-393:2-383)
10 20 30 40 50
pF1KB4 MLFDKVKAFSVQLDGATAGVEPVFSGGQAVAGRVLLELSSAARVGALRLRARGRAHVHW
..: :.:.: : .. : :...:. :::::..:. ..:: :.:. : : :.: :
NP_006 MVMFKKIKSFEVVFNDP----EKVYGSGEKVAGRVIVEVCEVTRVKAVRILACGVAKVLW
10 20 30 40 50
60 70 80 90 100 110
pF1KB4 TESRSAGSSTAYTQSYSERVEVVSHRATLLAPD--TGETTTL---PPGRHEFLFSFQLPP
. :: :. .. : . .. ::: : :::. . : ...:. :.:.::
NP_006 MQ----GS-----QQCKQTSEYLRYEDTLLLEDQPTGENEMVIMRPGNKYEYKFGFELPQ
60 70 80 90 100
120 130 140 150 160 170
pF1KB4 -TLVTSFEGKHGSVRYCIKATLHRPWVPARRARKVFTVIEPVDINTPALLAPQAGAREKV
: :::.::.: : : .:: : :: :.....: : :.. ::.::: :.:: .. .::
NP_006 GPLGTSFKGKYGCVDYWVKAFLDRPSQPTQETKKNFEVVDLVDVNTPDLMAPVSAKKEKK
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB4 ARSWYCNRGLVSLSAKIDRKGYTPGEVIPVFAEIDNGSTRPVLPRAAVVQTQTFMARGAR
. . : ::.::.:::::. :. : . :...: .: :.:.::.: .:..: :
NP_006 VSCMFIPDGRVSVSARIDRKGFCEGDEISIHADFENTCSRIVVPKAAIVARHTYLANGQT
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB4 KQKRAVVASLAGEPVGPGQRALWQGRALRIPPVGPSILHCRVLHVDYALKVCVDIPGTSK
: ..:. :. . : : :.:..::. . :::: : .:.:.:.: . :..::..:
NP_006 KVLTQKLSSVRGNHIISGTCASWRGKSLRVQKIRPSILGCNILRVEYSLLIYVSVPGSKK
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB4 LLLELPLVIGTIPLHPFGSRSSSVGSHASFLLDWRLGALPERPEAPPEYSEVVADTEEAA
..:.::::::. ..::.::..:..: ..: .:. ::::: : .:. :.
NP_006 VILDLPLVIGS--RSGLSSRTSSMASRTSSEMSWVDLNIPDTPEAPPCYMDVIP--EDHR
290 300 310 320 330 340
360 370 380 390 400
pF1KB4 LGQSPFPLPQDPDMSLEGPFFAYIQEFRYRPPPLYSEEDPNPLLGDMRPRCMTC
: . :: .: : : ..:.: : ::.. ::: :.: ::
NP_006 LESPTTPLLDDMDGSQDSPIFMYAPEFKFMPPPTYTEVDPCILNNNVQ
350 360 370 380 390
>>XP_016855574 (OMIM: 606599) PREDICTED: thioredoxin-int (395 aa)
initn: 793 init1: 529 opt: 876 Z-score: 956.6 bits: 185.9 E(85289): 1.5e-46
Smith-Waterman score: 876; 38.4% identity (66.2% similar) in 396 aa overlap (1-390:2-380)
10 20 30 40 50
pF1KB4 MLFDKVKAFSVQLDGATAGVEPVFSGGQAVAGRVLLELSSAARVGALRLRARGRAHVHW
..: :.:.: : .. : :...:. :::::..:. ..:: :.:. : : :.: :
XP_016 MVMFKKIKSFEVVFNDP----EKVYGSGEKVAGRVIVEVCEVTRVKAVRILACGVAKVLW
10 20 30 40 50
60 70 80 90 100 110
pF1KB4 TESRSAGSSTAYTQSYSERVEVVSHRATLLAPD--TGETTTL---PPGRHEFLFSFQLPP
. :: :. .. : . .. ::: : :::. . : ...:. :.:.::
XP_016 MQ----GS-----QQCKQTSEYLRYEDTLLLEDQPTGENEMVIMRPGNKYEYKFGFELPQ
60 70 80 90 100
120 130 140 150 160 170
pF1KB4 -TLVTSFEGKHGSVRYCIKATLHRPWVPARRARKVFTVIEPVDINTPALLAPQAGAREKV
: :::.::.: : : .:: : :: :.....: : :.. ::.::: :.:: .. .::
XP_016 GPLGTSFKGKYGCVDYWVKAFLDRPSQPTQETKKNFEVVDLVDVNTPDLMAPVSAKKEKK
110 120 130 140 150 160
180 190 200 210 220 230
pF1KB4 ARSWYCNRGLVSLSAKIDRKGYTPGEVIPVFAEIDNGSTRPVLPRAAVVQTQTFMARGAR
. . : ::.::.:::::. :. : . :...: .: :.:.::.: .:..: :
XP_016 VSCMFIPDGRVSVSARIDRKGFCEGDEISIHADFENTCSRIVVPKAAIVARHTYLANGQT
170 180 190 200 210 220
240 250 260 270 280 290
pF1KB4 KQKRAVVASLAGEPVGPGQRALWQGRALRIPPVGPSILHCRVLHVDYALKVCVDIPGTSK
: ..:. :. . : : :.:..::. . :::: : .:.:.:.: . :..::..:
XP_016 KVLTQKLSSVRGNHIISGTCASWRGKSLRVQKIRPSILGCNILRVEYSLLIYVSVPGSKK
230 240 250 260 270 280
300 310 320 330 340 350
pF1KB4 LLLELPLVIGTIPLHPFGSRSSSVGSHASFLLDWRLGALPERPEAPPEYSEVVADTEEAA
..:.::::::. ..::.::..:..: ..: .:. ::::: : .:. :.
XP_016 VILDLPLVIGS--RSGLSSRTSSMASRTSSEMSWVDLNIPDTPEAPPCYMDVIP--EDHR
290 300 310 320 330 340
360 370 380 390 400
pF1KB4 LGQSPFPLPQDPDMSLEGPFFAYIQEFRYRPPPLYSEEDPNPLLGDMRPRCMTC
: . :: .: : : ..:.: : ::.. ::: :.:
XP_016 LESPTTPLLDDMDGSQDSPIFMYAPEFKFMPPPTYTEVRIVIFTVKFVLSFL
350 360 370 380 390
>>NP_001300901 (OMIM: 606599) thioredoxin-interacting pr (336 aa)
initn: 733 init1: 529 opt: 776 Z-score: 848.9 bits: 165.7 E(85289): 1.5e-40
Smith-Waterman score: 776; 39.5% identity (67.5% similar) in 329 aa overlap (73-393:5-328)
50 60 70 80 90
pF1KB4 RVGALRLRARGRAHVHWTESRSAGSSTAYTQSYSERVEVVSHRATLLAP----DTGET--
.: :.: ..: :.:.: .::.
NP_001 MPPKHSLSHRC-ILSVTASLMATRFSFPSGENEM
10 20 30
100 110 120 130 140 150
pF1KB4 TTLPPG-RHEFLFSFQLPP-TLVTSFEGKHGSVRYCIKATLHRPWVPARRARKVFTVIEP
. . :: ..:. :.:.:: : :::.::.: : : .:: : :: :.....: : :..
NP_001 VIMRPGNKYEYKFGFELPQGPLGTSFKGKYGCVDYWVKAFLDRPSQPTQETKKNFEVVDL
40 50 60 70 80 90
160 170 180 190 200 210
pF1KB4 VDINTPALLAPQAGAREKVARSWYCNRGLVSLSAKIDRKGYTPGEVIPVFAEIDNGSTRP
::.::: :.:: .. .:: . . : ::.::.:::::. :. : . :...: .:
NP_001 VDVNTPDLMAPVSAKKEKKVSCMFIPDGRVSVSARIDRKGFCEGDEISIHADFENTCSRI
100 110 120 130 140 150
220 230 240 250 260 270
pF1KB4 VLPRAAVVQTQTFMARGARKQKRAVVASLAGEPVGPGQRALWQGRALRIPPVGPSILHCR
:.:.::.: .:..: : : ..:. :. . : : :.:..::. . :::: :
NP_001 VVPKAAIVARHTYLANGQTKVLTQKLSSVRGNHIISGTCASWRGKSLRVQKIRPSILGCN
160 170 180 190 200 210
280 290 300 310 320 330
pF1KB4 VLHVDYALKVCVDIPGTSKLLLELPLVIGTIPLHPFGSRSSSVGSHASFLLDWRLGALPE
.:.:.:.: . :..::..:..:.::::::. ..::.::..:..: ..: .:.
NP_001 ILRVEYSLLIYVSVPGSKKVILDLPLVIGS--RSGLSSRTSSMASRTSSEMSWVDLNIPD
220 230 240 250 260 270
340 350 360 370 380 390
pF1KB4 RPEAPPEYSEVVADTEEAALGQSPFPLPQDPDMSLEGPFFAYIQEFRYRPPPLYSEEDPN
::::: : .:. :. : . :: .: : : ..:.: : ::.. ::: :.: ::
NP_001 TPEAPPCYMDVIP--EDHRLESPTTPLLDDMDGSQDSPIFMYAPEFKFMPPPTYTEVDPC
280 290 300 310 320
400
pF1KB4 PLLGDMRPRCMTC
NP_001 ILNNNVQ
330
>>NP_001316599 (OMIM: 612464) arrestin domain-containing (194 aa)
initn: 681 init1: 524 opt: 699 Z-score: 768.6 bits: 150.1 E(85289): 4.5e-36
Smith-Waterman score: 699; 54.5% identity (78.0% similar) in 191 aa overlap (215-404:2-191)
190 200 210 220 230 240
pF1KB4 SLSAKIDRKGYTPGEVIPVFAEIDNGSTRPVLPRAAVVQTQTFMARGARKQKRAVVASLA
:.:.::. :::.:.:.: :. . .::.:
NP_001 MVVPKAAIYQTQAFYAKGKMKEVKQLVANLR
10 20 30
250 260 270 280 290 300
pF1KB4 GEPVGPGQRALWQGRALRIPPVGPSILHCRVLHVDYALKVCVDIPGTSKLLLELPLVIGT
:: .. :. :.:. :.::::.:::: : ...:.:.: : :::::. :.:.:::::::
NP_001 GESLSSGKTETWNGKLLKIPPVSPSILDCSIIRVEYSLMVYVDIPGAMDLFLNLPLVIGT
40 50 60 70 80 90
310 320 330 340 350 360
pF1KB4 IPLHPFGSRSSSVGSHASFLLDWRLGALPERPEAPPEYSEVVADTEEAALGQSPFPLPQD
:::::::::.:::.:. :. ..: .::::::::: :.:::.. :. . .: .:
NP_001 IPLHPFGSRTSSVSSQCSMNMNWLSLSLPERPEAPPSYAEVVTE-EQRRNNLAPVSACDD
100 110 120 130 140 150
370 380 390 400
pF1KB4 PDMSLEGPFFAYIQEFRYRPPPLYSEEDPNP-LLGDMRPRCMTC
. .:.::.::::::::. ::::::: :::: .: :: :
NP_001 FERALQGPLFAYIQEFRFLPPPLYSEIDPNPDQSADDRPSCPSR
160 170 180 190
>>NP_001316601 (OMIM: 612464) arrestin domain-containing (194 aa)
initn: 681 init1: 524 opt: 699 Z-score: 768.6 bits: 150.1 E(85289): 4.5e-36
Smith-Waterman score: 699; 54.5% identity (78.0% similar) in 191 aa overlap (215-404:2-191)
190 200 210 220 230 240
pF1KB4 SLSAKIDRKGYTPGEVIPVFAEIDNGSTRPVLPRAAVVQTQTFMARGARKQKRAVVASLA
:.:.::. :::.:.:.: :. . .::.:
NP_001 MVVPKAAIYQTQAFYAKGKMKEVKQLVANLR
10 20 30
250 260 270 280 290 300
pF1KB4 GEPVGPGQRALWQGRALRIPPVGPSILHCRVLHVDYALKVCVDIPGTSKLLLELPLVIGT
:: .. :. :.:. :.::::.:::: : ...:.:.: : :::::. :.:.:::::::
NP_001 GESLSSGKTETWNGKLLKIPPVSPSILDCSIIRVEYSLMVYVDIPGAMDLFLNLPLVIGT
40 50 60 70 80 90
310 320 330 340 350 360
pF1KB4 IPLHPFGSRSSSVGSHASFLLDWRLGALPERPEAPPEYSEVVADTEEAALGQSPFPLPQD
:::::::::.:::.:. :. ..: .::::::::: :.:::.. :. . .: .:
NP_001 IPLHPFGSRTSSVSSQCSMNMNWLSLSLPERPEAPPSYAEVVTE-EQRRNNLAPVSACDD
100 110 120 130 140 150
370 380 390 400
pF1KB4 PDMSLEGPFFAYIQEFRYRPPPLYSEEDPNP-LLGDMRPRCMTC
. .:.::.::::::::. ::::::: :::: .: :: :
NP_001 FERALQGPLFAYIQEFRFLPPPLYSEIDPNPDQSADDRPSCPSR
160 170 180 190
>>NP_001316600 (OMIM: 612464) arrestin domain-containing (194 aa)
initn: 681 init1: 524 opt: 699 Z-score: 768.6 bits: 150.1 E(85289): 4.5e-36
Smith-Waterman score: 699; 54.5% identity (78.0% similar) in 191 aa overlap (215-404:2-191)
190 200 210 220 230 240
pF1KB4 SLSAKIDRKGYTPGEVIPVFAEIDNGSTRPVLPRAAVVQTQTFMARGARKQKRAVVASLA
:.:.::. :::.:.:.: :. . .::.:
NP_001 MVVPKAAIYQTQAFYAKGKMKEVKQLVANLR
10 20 30
250 260 270 280 290 300
pF1KB4 GEPVGPGQRALWQGRALRIPPVGPSILHCRVLHVDYALKVCVDIPGTSKLLLELPLVIGT
:: .. :. :.:. :.::::.:::: : ...:.:.: : :::::. :.:.:::::::
NP_001 GESLSSGKTETWNGKLLKIPPVSPSILDCSIIRVEYSLMVYVDIPGAMDLFLNLPLVIGT
40 50 60 70 80 90
310 320 330 340 350 360
pF1KB4 IPLHPFGSRSSSVGSHASFLLDWRLGALPERPEAPPEYSEVVADTEEAALGQSPFPLPQD
:::::::::.:::.:. :. ..: .::::::::: :.:::.. :. . .: .:
NP_001 IPLHPFGSRTSSVSSQCSMNMNWLSLSLPERPEAPPSYAEVVTE-EQRRNNLAPVSACDD
100 110 120 130 140 150
370 380 390 400
pF1KB4 PDMSLEGPFFAYIQEFRYRPPPLYSEEDPNP-LLGDMRPRCMTC
. .:.::.::::::::. ::::::: :::: .: :: :
NP_001 FERALQGPLFAYIQEFRFLPPPLYSEIDPNPDQSADDRPSCPSR
160 170 180 190
407 residues in 1 query sequences
60827320 residues in 85289 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 06:04:44 2016 done: Sat Nov 5 06:04:46 2016
Total Scan time: 9.880 Total Display time: 0.020
Function used was FASTA [36.3.4 Apr, 2011]